一个算命准确度高达 78% 的 AI,让网友当上赛博阎王
一个算命准确度高达 78% 的 AI,让网友当上赛博阎王
咱中国人爱算命这事,是刻在骨子里的执念。
出门前要看看黄历、办公室要讲风水、就连谈恋爱换工作也要算算领导和对象的星座和八字合不合适。
算命姿势也是无奇不有,用八字星座塔罗牌已属过去式,寺庙求签不够潮。
这不,有位中国人就在 ChatGPT 上训练了一个 " 算命专用 AI" ——然后迅速成为 GPTs 中文榜排名第一的应用。
它可以根据你的生日提供命理分析,预测你未来 3 到 5 年的人生趋势,作者对它的定义是:" 传统与科技融合、趣味与理性结合的命理推测工具,准确到可怕。"
实际上就是在 GPTs 里上传了这些 PDF,然后用 Prompt 告诉应用去深入学习这些文档,融会贯通掌握中国古代命理八字算命技术,然后根据用户输入的生日,按照固定的格式输出结果。
然后就得到了当今网络三大邪术之一:赛博算命。
(附上链接,感兴趣的硅友们可以自己试试:https://chat.openai.com/g/g-cbNeVpiuC-aisuan-ming。)
不过这还不算什么,丹麦一研究团队做了个大模型,名为 "Life2vec",字面意思是 " 人生变向量 ",可以直接预测人的死亡率,准确率高达 78%,据称是市面上准确度最高的预测方式。
这谁敢试?
(图源:微博)
之前团队就曾经尝试过用机器学习模型,结合健康、家庭、教育因素来预测一个孩子未来生活的走向,结果准确率很低。
感谢 transformer 算法,现在他们能够将上述这些因素形成一个完整的时间序列轴,从而大幅提升了预测的准确度。
于是团队找来了 600 万丹麦人 12 年里生活的点点滴滴,从住哪儿、在哪个学校上学、现在在哪里工作、一个月赚多少钱等等一应俱全。
乍一看很像过年回家接受七大姑八大姨查户口,这个还更费劲,盘问一年只来一次,而他们是 365 天不间断记录。
数据要用在大语言模型上,那就要变成语言模型能读懂的句子。
所以团队把这些鸡毛蒜皮的事儿整理成了一条条人生轨迹,比如:在 2010 年 8 月,艾格尼斯女士的工作是助产护士,月入 3 万丹麦克朗。再辅以这个人的出生日期和地址等信息,就形成了一个完整的链条。
从下图来看,这个模型预测生死的主要指标分为七个:健康水平、出生年份、住址、行业、工作岗位、收入水平、劳动能力。
这些彩色的小点就是语料库里的 token,每种颜色代表一个种类。
那高达 78% 准确率的死亡率预测又是怎么来的呢?研究人员还是用了最传统的方式,把数据库分两半,用前 8 年的数据训练模型,预测剩下 4 年里的死亡率,下图圆点是预测出来的死亡率,从黄到绿代表死亡率从低到高。
简单来说,绿色点代表模型预测中后面四年死亡率极高的人,而红点则是真实世界中确认死亡的人。
据此得出结论,模型说 " 你的死亡率极高 ",那有 78% 的概率代表它说的没错。
话又说回来,这模型发现的英年早逝的风险因素过于平平无奇了——比如收入低、比如身体不好、比如接受过心理治疗。
有意思的是,在丹麦,男性、且具有高级职业技能的人群死亡风险更高一些,难道是因为过劳?
不过倒也不用担心到自己头上,模型是根据丹麦人真实的生活数据训练出来的,预测出来的结果也是仅丹麦适用。
按照团队的设想,这个模型可以在早期预测到还没发生的健康或社会问题,帮助政府对症下药,尽早消灭不平等问题。不过要是保险公司用上这套模型,那你就可以根据保费的涨幅来推测自己剩余的年限了。
团队成员也早想到了这点,强烈不建议这个大模型商业化,尤其提防保险行业。
科技总是一把双刃剑,具体看往哪个方向挥。其实类似的预测模型之前也出现过,澳大利亚一个团队可以通过数据预测青少年的自残和自杀企图,准确率比专业心理医生还高。
所以建模和预测这件事本身没有问题,主要还看模型的用途是什么。
说到用途,Life2vec 的用途还不止能预测死亡率这么简单,它还能根据你的人生轨迹来反推你的性格。
团队从性格测试方面比较权威的模型里挑了一些题目,然后找了一些信息在他们数据库中的人来做性格测试。
比如在 " 我更喜欢跟别人一起工作而不是一个人埋头苦干 " 这道题上得分更高的人,更喜欢交际。
然后把人做的结果跟模型预测相比较,发现预测的准确度比盲猜和神经网络算法高得多。
看起来还挺眼熟,这不就是 MBTI 性格测试嘛!
比如自己选择当理发师的人,大多不会是 I 人;身体不好需要长期卧床休养的人,性格上大致不会太活泼。
但比起现在性格测试界主流的做题,相对来说用大模型其实更能真实地反映一个人的性格。毕竟做题凭借的是测试者对自己的主观评价,而模型用的直接是生活中的行为。
不保证没有一些人嘴上说着 " 一旦确定了目标,我会坚持努力地实现它 ",然后一年两年三年过去了体重还是没有变化。
相比较之前社会科学界常用的 " 我们发现收入越高的人群预期寿命越长 " 这种类似废话的研究,Life2vec 第一次真正站在个人的角度上,提供了一个可以从今天的选择,窥探未来人生样貌的可能。
不管怎么说,这种靠数据算命的方式总比互联网玄学大师要强太多。
比如下面这位,先选几个功成名就的大哥出来,然后找他们脸上有什么共同点,这就叫面相大师了?
那我也来一个:都说姓马的人容易成大事,不少知名企业家都姓马,比如:
(图源:微博)
标签: