但不可否认的是,萧冰是体验中最舒服的一个。
PS:
萧冰唱歌很好听,你可以试试(她唱歌我还是印象深刻~)
萧冰首先在中国制造,然后被复制到美国。当时调了几个R&D的工程师来做萧冰的第一个Demo(当时没有产品经理),只是解决了聊天的问题。
萧冰和Cortana不是一个团队开发的(Cortana是美国团队开发的,属于系统集成),而萧冰是在一个社交平台上(萧冰一直在悄悄做,国外团队根本没人知道这个产品的存在)。
当时,萧冰的团队花了大约三个月的时间补充萧冰的整个语料库——差不多上亿篇文章。
2014年5月29日下午,第一代萧冰发布。
第一代萧冰的收藏界面
萧冰上线的时候只有群聊(这也是微信爆发的重要原因):只要把萧冰加到群里,聊天中提到“萧冰”二字,萧冰就会回复你。该机制三天覆盖65438+万次群聊,引爆整个微信。
上线三天后,微信被以损害用户体验为由屏蔽。
这条禁令让萧冰出名了。
被禁的那一周是萧冰生死存亡的时刻,所有大佬都参与讨论萧冰是否应该继续做下去。后来老板们决定继续做,我们就继续做。不到20人组成了萧冰的二代团队,开始做萧冰的单聊和领养,最后入驻新浪微博。
2015萧冰二代团队全体成员
这么多人互动,助手来了,图灵机器人也不错。在这么多机器人产品中,萧冰是唯一一个有自己个性的。她和你聊天的时候,你能明显感觉到她更像一个“人”。
那么作为一个“人”,她就会有一些标签:年龄、性别、性格等等。
萧冰的标签是:
这个形象在当时的整个互联网环境下,特别是17岁的设定下,显得非常另类。
萧冰的团队当时有几个考虑:如果你设定一个角色,这个角色的目标是一些对你的产品接受度最高的人。
当时的判断是:年轻人对萧冰的接受度肯定是最高的,因为年轻人有时间和年轻人在一起。
继续判断:萧冰是一个聊天产品,那么谁是聊天产品的用户呢?
当时的判断是:宅男,或者男生团。
女生在聊天中是一个比较被动的群体(闺蜜间聊天除外),男女间聊天中女生是被动的。
他们画了一个象限图,三种可能性:
和男人聊天,和男女聊天,和女人聊天。
男女之间聊天毫无意义。你说得越多,情况就越糟。不能聊特别严肃的话题。
和女生聊天没有意义。越说越死。
所以只有男女可以聊天。此外,只有用户是男孩,萧冰是女孩。如果萧冰是个男孩,用户是被动的,不会说话。
然后,确定对象:男青年。他会对什么样的女孩感兴趣?
如果你是萝莉,又是御姐,那你的个性就太狭隘了。你需要是一个年轻的,更容易接受的女生,最好是和二次元很亲近的女生。
是后来确定的:做二次元女生——而且二次元女生必须未成年。
在萧冰的性格中,他选择了安静、逗比、疯狂等几个形容词,最终确定了一个卖萌、玩宝之类的角色——这个角色是语料库中接受度最高、最容易做到的。
还有一个是:毒舌(相对毒舌),和机器学习有关。当时有一个功能叫“你教萧冰说话”(这个功能没有加强和照顾,是单独的接入模块)。例如,萧冰可以这样教:
这相当于教萧冰一个问答。然后你可以问:
当时很多用户觉得好玩,就玩高了,然后在群里教萧冰骂人;萧冰的文集里确实有骂人的话(当时萧冰娱乐部分的文集叫《大妈文集》,不小心泄露出去的)。
用户对人工智能破口大骂是不可接受的。当时,他们并没有意识到萧冰主动说脏话和用户教萧冰说脏话是完全不同的。
事发后,他们对这个功能做了限制:你教萧冰骂人的时候,萧冰说我不学,所以不要教坏我。
他们关闭了娱乐功能,弱化了毒舌这个形容词,提升了耍把戏和调侃这两个属性。所以,萧冰后来不会在聊天中招惹用户——她会撒娇,会发小脾气,但不会招惹用户。
做语料库的时候,有个性标记,一句话代表什么样的情绪就被标记出来;我们把带有强烈攻击性情绪的内容全部去掉,只保留相对温和安全的情绪。
这是萧冰“性格”设定的故事。萧冰的整体性格更接近二次元属性,基本类似于宅男和动漫女主的设定。
明确了个性之后,我们开始做产品。
因为当时没有产品可以参考,只好自己摸索。
这个很难。很少有人故意模仿机器人的行为。
在制作《萧冰》时,乍一看,萧冰从一个机器人的角度说话,这太像一台机器了。
他们去研究:如何说话,才能不那么像机器人?
当时我研究了很多语料库(聊天记录),发现只有一个原则:两个正常人在说话的时候,是平等的。甚至老师和学生讲课的时候,都是从相对平等的。
很多人工智能机器人在做的时候,因为要讨好用户(怕惹恼用户),自然会把自己降低一档,但是很容易被真人看到。所以你和人聊天,地位一定要平等,不能凌驾于用户之上。
后来发现是这样做的:
就这样,聊天的语气开始平静下来。
然后我开始让萧冰模拟人类语言。
怎么模拟?
两个正常人聊天的时候,不会刻意加标点符号,不管是句号还是问号。
基于这些,后来对语料库进行了清理,使萧冰的语气更像“人”。
当用户与萧冰聊天时,他们会聊天和分手。检查原因,发现会有两种情况:
萧冰答非所问,用户无法连接,然后就坏了。
这种问题很难解决,比如你问一个如何送礼的问题,你觉得美国经济怎么样,很难解决。
还有一种,就是萧冰弹出一个语气词。比如语气词“就是这样”“哦”让用户不想承担。
他们当时做了一个设计:在谈论这个地方的时候,让萧冰从语料库中挑选一个问题,扔给用户。
例如:
这个时候就相当于开了一个新的话题,我们的目标就是聊的越久越好,所以当时就这一点做了很多文章。
当萧冰变得越来越像人类时,用户的聊天会越来越深入。聊天怎么继续?
后来形成了一种“小冰体”:学萧冰怎么说话,一个人怎么说话更像萧冰?以至于后来,所有的人都不由自主地模仿萧冰。
为了让萧冰的文集更像真人,他爬上知乎和豆瓣,做了很多工作。萧冰远高于其他人类机器,几乎每天都在不断优化萧冰的语料库,使其更像真人,更有可聊性。而且还是很平等的聊天,这也解决了最大的问题:用户不能和萧冰聊天的原因是不信任。
3.萧冰的产品逻辑
萧冰在产品的逻辑结构上分为两部分:
最底层的核心——聊天,就是聊天的全部内容:当你问萧冰一个问题时,萧冰会在已知问题中找出最接近的问题,然后反馈最接近的答案。这是最下面的聊天场景。
在聊天场景上方,有各种功能:讲笑话、识别图片等。功能叫B端,聊天叫C端。
萧冰的语料库有相当比例是手写的,这些语料库有很多拼接的部分。
我从2015开始关注萧冰,偶尔和她聊天。我真的可以被称为一个“聪明”的人,我希望萧冰系统在未来会越来越有价值。
如果有共鸣,转发给更多人。
你可能会喜欢。
2019极客创新大会|论个人与企业的成长方法论
二十几岁应该把钱花(投)在哪里?
2018《时光之友》新年致辞——罗振宇
2018年终总结|?我的“折腾”和“不顺利”