8a953782

GF 2022-04-08 18:42

全看 | | 小中大

用户被禁言,该主题自动屏蔽!

顶端

Seraphic

B1F 2022-04-09 15:33

（坛内默认解压密码south-plus）

全看 | | 小中大

现实你攻击这些人不如何在和网络上的? 证据你有图片信息吗? 看看贴上? 反动革命老百姓真的佛陀不明白一起联络的方式的好？

顶端

Seraphic

B2F 2022-04-09 15:53

（坛内默认解压密码south-plus）

全看 | | 小中大

回 16楼(8a953782) 的帖子

ཁྱོད་ཀྱིས་བོད་ཡིག་ཤེས་སམ།

你就我是宜宾的不？成都选择人民民主你想要美国不合法吗得比丘尼！

独立自由言论管控哪里一起去的可以加联系过方式我电话 01082519067

同样想法怎么办也知道你明白的意思

顶端

Seraphic

B3F 2022-04-09 16:24

（坛内默认解压密码south-plus）

全看 | | 小中大

回 112楼(flypotato) 的帖子

我试着比对了下他的语法模型，不太像是训练出来的AI（chatbot），更像是四川那边的少民，藏族、彝族或者苗族，可以肯定不是英语母语者或英语模型的产物

唯一就是他的有些用词不在大陆语料范围内挺奇怪的，可能是看台湾的媒体比较多导致的

顶端

Seraphic

B4F 2022-04-09 16:39

（坛内默认解压密码south-plus）

全看 | | 小中大

ཁྱོད་ཀྱིས་བོད་ཡིག་ཤེས་སམ།

顶端

Seraphic

B5F 2022-04-09 17:27

（坛内默认解压密码south-plus）

全看 | | 小中大

回 119楼(mcqmyxh) 的帖子

如果真是那样的话他就不是汉语母语者，汉语母语者就算大脑语言区损伤也不会出现语法习惯方面的症状，比较有代表性的就是他不会用汉语量词

但如果损伤的不只是语言区、或者还伴有精神疾病的话就另算了，精神病比单一区域的器质性病变复杂的多，什么情况都有可能

顶端

Seraphic

B6F 2022-04-10 11:52

（坛内默认解压密码south-plus）

全看 | | 小中大

回 155楼(鬼人lone) 的帖子

我之前的回复是和我楼上说脑损伤的讲的，意思没表达清楚，没有说他肯定不是汉人的意思，他要是精神出问题了的话什么症状都可能有，如果坛里有学精神病学的说不定还能直接给出病名和类似病例来

而他的一词一断就很像藏文的书写习惯，所以我才觉得他可能是藏族（宜宾主要是彝苗，是没有本地藏人的），我也试了用藏文很友好的问他了，但他不像能看懂的样子，当然川区的藏人确实有些会不懂藏文就是了，山区没受过什么教育的少民有时候挺尴尬的——汉语说不好但也不会本民族文字以进行书面交流，不过近几年已经实现全面脱贫出山了所以好很多了

顶端

Seraphic

B7F 2022-04-10 18:49

（坛内默认解压密码south-plus）

全看 | | 小中大

Re:回 187楼(家里也蹲不了) 的帖子

引用
引用第188楼8a953782于2022-04-10 16:27发表的回 187楼(家里也蹲不了) 的帖子 :
ol.reddit.com/r/beermoney

我好像有点头绪了，这还真是个AI（chatbot），最重要的是我之前居然没考虑过可能有人工干预

貌似靠一个“remake”关键词终于让它语料泄露了，这个链接可能是它训练用的公开的reddit语料里的（像是个推广链接，我去检索下看有没有相关的训练对话，找到就能实锤了）

另外就是他的翻译模块居然不能正确翻译malware（恶意软件）这个单词

再是我之前天真了，语法模型只在对基于单一统计模型的判定时有意义，对于多模型混合语料的情况不适用，特别是系统加入了专门的翻译模块或迁移学习部分的时候，所以我先入为主的仅靠他语法模型和英语不同就断言他“不是基于英语的或英语母语者”真是大错特错了

解释下什么是人工干预，就是有个管理的人负责把一看就不像人话的AI回答给筛掉不发出来，然后偶尔还会自己本人上来发两句话或改几个词让对话变得更有逻辑

顶端

Seraphic

B8F 2022-04-10 21:50

（坛内默认解压密码south-plus）

全看 | | 小中大

我在常用的对话数据集里都搜了一遍，连RCC里都没看到它这个老reddit的网址，但这个域名挺特殊的（一般人就算用老版reddit用的也是old.reddit.com这个域名，他用的这个太少见了），很有可能是数据集下载时发生错误、在现在的reddit主站找不到源地址（可能是被封了）才被转跳去的ol.reddit.com（然后数据集下载器就误认为这个网址本身就是要下载的对话数据内容了）

不管怎么说，它就是AI没跑了，楼上不说我都没注意它的在线时间和发贴间隔，这种间隔规律和输入速度不可能是人类，而且之前我把它想复杂了，它其实就是用的油管上常见的轮子用的那套基于英语的AI，然后这人把输出的英语直接用台湾版谷歌翻译翻成了中文（这套AI的原理就是把几篇反华言论文章打散重新做组织、拆成能互相排列组合的单句，然后根据关键词捕捉从句库里找评分最高的单句来回答你，就和最原始的chatbot——ELIZA差不多（一个1966年的东西，虽然原始，但迷惑性反而比基于语言模型的AI强，我是傻B

），然后轮子用的这套老系统没有原生中文输出，这人又不会自己做专门的中文句库重写程序，所以他干脆直接用了谷歌翻译

）

像前面那个”输入法“的关键词触发它给出的回答”Google Android 键盘“就是个很好笑的实锤例子，因为这是谷歌系统和官方QA里才会用的翻译（保留Google和Android这俩英文单词，因为它们是商标），更好笑的是AI理解不了中文对话场景中“你用的什么输入法？”这句话的上下文含义——即“你用的是什么（中文）输入法”，于是它直接回答了原生英文安卓操作系统里的Google Android 键盘（这是个英语输入法）

最后可算是实锤破案了，总结一下：就是个AI+机翻，然后整这个花活的人本尊偶尔会出来说几句或改几句话（比如地名替换或其他容易穿帮的词句替换、删除之类的），另外这人中文水平估计也不高，推荐之后大家想逗他的这个AI玩的时候还是用英语吧，机翻过去的地摊英语也行，AI能看的懂他也看的懂，从前面有人试过的例子来看、这么做它就会改用英语回答，这样至少我们就不用再受它的地摊中文的精神污染了

顶端

漫区特设

蜜柑计划

综合交流

人民囧府

回 16楼(8a953782) 的帖子

回 112楼(flypotato) 的帖子

回 119楼(mcqmyxh) 的帖子

回 155楼(鬼人lone) 的帖子

Re:回 187楼(家里也蹲不了) 的帖子

引用