我在常用的对话数据集里都搜了一遍,连RCC里都没看到它这个老reddit的网址,但这个域名挺特殊的(一般人就算用老版reddit用的也是old.reddit.com这个域名,他用的这个太少见了),很有可能是数据集下载时发生错误、在现在的reddit主站找不到源地址(可能是被封了)才被转跳去的ol.reddit.com(然后数据集下载器就误认为这个网址本身就是要下载的对话数据内容了)
不管怎么说,它就是AI没跑了,楼上不说我都没注意它的在线时间和发贴间隔,这种间隔规律和输入速度不可能是人类,而且之前我把它想复杂了,它其实就是用的油管上常见的轮子用的那套基于英语的AI,然后这人把输出的英语直接用台湾版谷歌翻译翻成了中文(这套AI的原理就是把几篇反华言论文章打散重新做组织、拆成能互相排列组合的单句,然后根据关键词捕捉从句库里找评分最高的单句来回答你,就和最原始的chatbot——ELIZA差不多(一个1966年的东西,虽然原始,但迷惑性反而比基于语言模型的AI强,我是傻B
),然后轮子用的这套老系统没有原生中文输出,这人又不会自己做专门的中文句库重写程序,所以他干脆直接用了谷歌翻译
)
像前面那个”输入法“的关键词触发它给出的回答”Google Android 键盘“就是个很好笑的实锤例子,因为这是谷歌系统和官方QA里才会用的翻译(保留Google和Android这俩英文单词,因为它们是商标),更好笑的是AI理解不了中文对话场景中“你用的什么输入法?”这句话的上下文含义——即“你用的是什么(中文)输入法”,于是它直接回答了原生英文安卓操作系统里的Google Android 键盘(这是个英语输入法)
最后可算是实锤破案了,总结一下:就是个AI+机翻,然后整这个花活的人本尊偶尔会出来说几句或改几句话(比如地名替换或其他容易穿帮的词句替换、删除之类的),另外这人中文水平估计也不高,推荐之后大家想逗他的这个AI玩的时候还是用英语吧,机翻过去的地摊英语也行,AI能看的懂他也看的懂,从前面有人试过的例子来看、这么做它就会改用英语回答,这样至少我们就不用再受它的地摊中文的精神污染了