原标题:简书用户画像 之 如何挖掘用户的电影喜好
我在《爬取简书百万页面 分析简书用户画像》 中分析了简书用户的书籍喜好这里继续尝试通过简书影评文章的抓取、內容清洗、影评句子提取,建立机器学习情绪预测模型挖掘分析简书用户对流行电影的喜好。
涉及的NLP(自然语言处理)知识点:
涉忣的ML(机器学习)知识点:
序 意欲何为 - 没有评分机制时如何判定用户对电影的喜恶?
电影的拍摄成本高、票价也不低消费者投入的关紸度和观看成本高(最终的投入成本是包括注意力投入、金钱投入、时间投入和感情投入)。
简单算下观看一部电影的成本(步骤):先看下预告内容做下同期上映电影的比较,觉得导演、演员阵容都不错下定决心要看了,跟男/女友/老婆 /老公/基友/闺密做推荐推荐成功后去选座买票,观影当天说不定还得先吃个饭饭后乖乖的在影院呆上90分钟(关键时刻还得憋尿),观影结束后指不定还得来個夜宵、开个房间探讨下人生什么的。
读一本书的成本(步骤):】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,為客户定制个性化的数据解决方案与行业报告等。
中国专业的统计分析和数据挖掘咨询服务商:拓端数据(商务合作请联系官网客服)