我们每天都在接受,也在生产着大量的信息。基本上每一个App软件或者服务类型网站,都会存储你的个人信息。 而这一切的个人信息的载体,就是绑定了你的手机号的所有「社交账号」,而你的手机号绑定的,是承载着有关于你这个人所有个人信息的「居民身份证」。
我们最离不开的是「微信」和「支付宝」,同样是因为他们绑定了我们的银行卡,而银行卡也毋庸置疑地绑定了你的「居民身份证」。 而这,也让所有使用便利的科技的人类成为了最不在乎隐私的生物。
万物互联,我们在使用手机的那一刻,便与所有其他使用这些智能与便利的人形成了链接。 这也就不好奇为什么我们想要什么,我们就能立刻在电商平台上得到这类商品的靶向广告。当然,任何APP都无权监视和监听使用者的谈话,这是写在注册该应用账户时的「terms and condition用户使用协议」里的。那这些电商平台又是怎么样使用「读心术」来获取我们的信息呢?
首先,我们每次打开网络,除了点开出现在首页的让我们「感兴趣」的网页以外,更多的则是进行「搜索」。
而我们每一次的「搜索」记录,都会被保留存储下来。
同理,我们的每一次的「购买记录」也被计算,
无论是购买的「日用品」的频率,
偏好购买的服装鞋子的「品牌」,
还有我们的「常用收件地址」,
昨天中午吃的「外卖」,
或是「bilibili」/「抖音」上看过的视频记录,
都能帮助大数据人工智能去对我们进行「用户画像」,进行「标签化」。
人工智能通过「算法」,对我们每天产生的海量信息中抓取我们的「习惯」,根据权重来判断什么产品能对我们产生「吸引力」 。根据网络视频媒体「PaperClip回形针」的视频让我学习到一个计算兴趣权重的函数公式。
如何计算兴趣权重?
兴趣权重=行为权重X访问时间X衰减因子
行为权重:是/否「点击」「评论」「点赞」「转发」「收藏」,就如同Bilibili上对该视频的「点赞」「投币」「收藏」一样。
不同的行为对应着不同的权重, 如「点击」只能算0.1,因为人工智能无法计算点击行为是否因为「标题党」或者「误点」
「阅读」行为则会根据你的实际「停留时间」进行权重计算。部分文章已经实现了根据「特定兴趣点/兴趣段落」的停留时间来计算权重的功能。
「收藏」则代表以后会分享,或是留着备用,而「转发」到朋友圈不屏蔽任何人的行为权重更高。当然也不排除一些文章不怎么看直接就转朋友圈的冗余数据。
而「衰减因子」,则代表我们对该兴趣点的持续热度是否会因为时间而渐渐消失。如果我们长时间阅读同一类型的文章,那么我们就会得到更高的权重。
最后,根据这些兴趣权重进行累加,再通过S形函数进行逻辑回归分析。就能得到一个0-10的兴趣标签值。数值越高对应着更大的几率被推送这类的广告。
与「阅读习惯」「搜索习惯」相对应的,还可以将这套算法套用在计算「消费能力」以及「社交兴趣」上。
这些偏好会转换为「特征向量」 比如我对摄影兴趣的向量是「8」我的消费能力是「5」我的社交偏好是「2」,那么我的「特征向量就是r(8,5,2)」。如果我把这个向量理解为多维空间的一个坐标 ,那么大数据人工智能算法就能通过这种方式,来计算与我有同样「兴趣爱好」「消费能力」「社交偏好」的人,进而进行用户分类。
微信和淘宝的数据计算系统最后会对我们生成一个接近完整的「用户画像」,以便广告主对我们生成针对我们的靶向广告和商品推荐。
对于广告主来说,这样的程序化广告投放无疑减少了大量的调研成本,能极大程度减少不必要的资源浪费。
腾讯广告-开发者文档:如何投放广告
腾讯广告-开发者文档:腾讯社交网络架构
对于消费者群体来说,这样的行为也意味着我们会花更少的时间去逛也许是我们感兴趣的产品。很有可能我们在遇到某一个让我们心动的产品后直接停止了购物浏览行为。从一方面来讲,这也节省了我们大量的时间。