当前位置: 首页> IT业界




专访丨若琪:无意间搞了个大新闻,但会用产品证明­我就是未来

发布时间:19-10-28

[ 导读 ] 也许你曾被若琪在知乎上的文案整懵过,不过,炒作并非它的本意,知乎用户们的“吐槽”也并不一定客观。这篇文章会让你清楚地透视这款语音机器人的产品本身。

♯♮

“回应一下某知乎用户‘这就是个装了科大讯飞的安卓手机’的吐槽?”

Ю

“斯文一点回复,那就是,没有想象力的井底之蛙。”

这周五,记者柯东去杭州拜访了若琪——传说中基于AI技术,能远场精准识别语音实现听歌、查新闻、聊天以及控制智能电器等功能的小机器人。

不同于许多安家在高楼大厦的科技〩项目,若琪坐落于西溪湿地,被湖畔环绕着(大明湖畔夏雨荷既视感?)。在乘坐高铁、地铁、公交车、ofo、游览车五种交通工具后……记者终于与若琪相遇了。

前不久,由于一些“超乎人性”的广告文案,若琪,这个看名≈字本应很文静的机器人却在知乎上“搞了个大新闻”。不过,本次采访并不Γ只是八卦这件事,更多注重于外界对产品的疑惑、产品用户体验和技术突破、AI的想象空间、创始人神秘背景等层面。

面对来自用户及网友对└若琪发出的“λ灵魂拷问”,我们来看看产品负责人向文杰与品牌负责人Tim是怎么说的。

很多人对若琪的文案不明所以,不知道若琪强调的功能究竟是什么。如果说Amazon的E▌cho的切入点是音箱,那若琪的切入点是什么?

向文杰告诉记者,若琪的思路其实就是以语音控制作为切入点,变成家庭的一个中心,解放人们‥的眼睛与双手。

“外界的人可能会把Echo或若琪只当成智能音箱,但实际上真正|开发或使用的人不会这么认为。就比如说iPhone,你首ō先是以手机这个容易理解的概念去认识它,但之后你会发现你更多是用它发微信而不是打电话发短信。”

向文杰认为一开始人们会让若琪放音乐,但之后会认识到她其他功能的价值,比如通过对话直接让她设置闹钟、播报天气、给小朋友讲故事,还能问她百科知识和实时新闻,另外一个核心功能就是语音掌控智能家居。“跟÷她说句早安,她便自动帮你冲制啡,调节灯光和温度,净化空气等ⓥ等。”

“所以我们产品的定位并不完全是音乐,当然它۩音质确实很棒。它最重要的两大服务一个就是以内容服务δ为主的家庭Э陪伴,另一个就是智能家居。”

若Ⅵ琪是个伪需求产品,只能用来听歌?

记者了解到,若琪能控制Phi卍lips、LifeSmart、Broadlink、Orvibo、米家等品牌的智能电器,其中包括灯具、窗帘、电视、插座、空气净化器等,目前正在进一步开拓合作伙伴。

智能家居在中国正飞速发展,但远远还未普及,有网友质疑若琪解决的事情是伪需求,那么,若琪会不会在智能家居普及前沦为儿童玩具?

“我们从来没有担心过这个问题”,向文杰说道,“若琪最初主打的目标用户就是成年人,当正式售卖的时候,我们也会发现成年人的购买决策很奇怪,有的人会觉得音质挺不错的,然后也可以给小朋友用——增加了一个购买理由。”

向文杰表示用户一般会产生“音质不错”—≌—“小朋友能用挺好的”——“还能控制电器”这个思路。▪“智能家居现在还不够多,但马上就要来了。这也是若琪一个很有魅力的地方——给用户一种走向未来、畅想未来生活情景я的感觉。”

向文杰认为∴若琪还能帮助老人使用电子设备:“只要能说话,若琪就能发挥作用,会有一些老人慢慢习惯去用它。”

据悉,在前几天杭州的未来生活节上,一名80多岁的◈老人特地为了若琪来观展。“我迫不及待要知道未来的生活是怎样的,若琪真的能给我这种感觉。它有时听〨不懂我说的话我也非常理解,因为我明白它的原理。我准备带着若琪去旅游。”市场经理骆小白给记者转述了老人当时的话,记者得知老人用了本打算ю买保健品的☺☻钱买了若琪。

若琪与Echo、Google Home有什么不同之处?

那么,相对同类产品的先行者Echo与Google Home(目前都只支持英文),若琪的优势是更本土化,并且具备两个音节唤醒与远场精准识别的核心技术。

“文化与商业环境的差异会导致你本土的优势到了国外后完全没作用,Echo是美国智能家居的破局者,它上边承载着一万多个应用,但到了中↙国可能什么用都没有。”同┍时,唤醒Echㄨo需要说Alexa四个音节,唤醒若琪只需两个音节Ⅰ,向文杰认为这不仅是文化差异也是技术差异。“下一◎步我们会努力做到一个音节就能搞定,甚至是用手拍一下就可以。”

不同于科大讯飞的语音识别,向文杰告诉记者若琪的技术最大关键是远场精准识别,机器本身最远可以支持十米远距语音交互,这一点亚马逊和谷歌都还没有做到。“如果一个设备只能支持五米,那你还得考虑是不是要走过去和它说话,这就好像和Siri说话还得摁一下。机器人本质应该是工具,而不是人类去迁就它们。”

在这方面,有用户希望若琪增加无线麦克风以覆盖所有房间。向文杰表示这可能不是最佳的解决方案:“我们计划做得更轻量、ψ简单一些。”

网友说若琪的“舌头”捋不直?还会与电视对话,是不是意味着它不能识别用户语音?

记者了解到给若琪配音的声优是经过精挑Ё细选的演员,团队目前正在让该演员录入更多的场景话语,并通过改进算法调整若琪说话的┚韵律和节奏,使其发声时更接近真人说话的风格。

“不追求声音精准无误,我们追求的是声音与若琪的形象高度契合。”不过,这名演员的身份暂不方╭╮便透露。

在语音身份识别这方面,若琪正在不断地提升技术。“现在要做的第じ一次见面就能认识还做不到,但是用久了是可以识别的。”在与若琪对话时,记者发现若琪会在说话的人的方向亮起灯,只回应位于该方向的声音,除非Θ其他方向有人▋叫她的名字——这样确实能在一定程度上解决其他语音的干扰μ。

五千多的和一千多的若琪有啥区别?她说话的数据来源于哪里?

不少网友吐槽若琪很贵。第一代若琪确实很美,不仅是一项科技产品,更像是一个魔幻又有未来感的艺术品——并获得了红点设计奖。不过第二代的若琪的一千多元价格还算亲民。

据了解,不同于“就差能走能动”的“Alien •外星人”,第二代的“月石”省略了显示屏、摄像头、人脸识别、触摸等功能,且重量更轻,易于用户随身携带。“未来的产品成本不一定会加大,但一定会更加普及。”若琪提供开放平台,第三方开发者可自由添加自己想要的功能。

第二代若琪

AI能做到“人性”,本质还是基于强大的数据基础。除了团队录入的数据,若琪的数据还来源于互联网抓取,以及用户的数据。“用户购买时我们会请求同意有关数据方面的授权来把若琪训练得更聪明。”

项目团队目前有100多人,在美国与北京均设立有人工智能实验室。自2014年以来项目已获得三轮风险投资,总额近3.8亿元人民币,今年年底将会公开有关下一轮融资的消息。

聊完以上问题,记者还了解了一些小八卦。

知乎上的广告文案并非想炒作

品牌负责人Tim告诉记者,长远的目光看若琪要捕获3~80岁的人群,进入千家万户,目前主要针对的是爱好科技产品≥,注重生活品质的白领阶层,这也是若琪选择知乎作为Δ宣传阵地的主要理由。

“除此之外,知乎是个开放的、持续性的讨论社区,对我们了解市场与用户的反映有好处。”

有网友爆料,若琪在知乎上的宣传文案是和杜蕾斯同一家的外包营销团队写的……Tim表示这一点不方便透♥露。“我们原意并不是要制造争议,只是想让推广显得更生活化与口语化。争议最强的是‘儿子要有你一半聪明就好了’的那句——其实这个是一般人开玩笑才会这么讲话。总之我们的初衷并不是想炒作,这和我们的品牌方向大大不符,打造品牌,我们是要用产品来说话的——技术才是真正重要的东西。”

谈到网友对若琪“一个装了科大讯飞的安卓手机”的Ⅳ描述,若琪团队认为这未免太缺少想象力,是井底之蛙之见。“一些人并不知道自己未来会站在什么地方,当他真正地去体验这个产品才会有所明白。”

类脑智能技术的想象空间与创始人Misa的“神秘背景”

向文杰认为人工智能当前还只是个工具,要达到《西部世界》、《真实的人类》等科幻片里的水平还为时过早,他也并不知道还会有多长的时间。“看到过一句评论,说的≈是人类在与AlphaGo一起来了解什么是围棋。AI是一个好的工具,在教人类探索围棋,就像是航天飞机在教人类探索太空一样。它们并不是说要变成另一种人类,我觉得现在大家把AI理解成类脑技术这块的话太早了。”

不过├,他认为AI的发∝展的起点确实很高。就像人类的发展史——从无机物变成有机物,最后变成一种有思维的东西,如果人类都能产生,那么AI也许能找到符合自己演进的方式。“也许这个世界有神吧。”

据传说,创始人是一个只知道其英文名不知道其大名的神秘单身人士。从交谈中记者了解到,Misa是一名性格内向低调的极客,┗他是原猛犸科技的创始人。

“他花了几个星期架构了所有代码,把框架搭建完成,由我们在里边填内容。大概过了一年多时间,猛犸科技就被阿里收购了。他的作品展现在阿里云os的核心代码中。”

之后Misa任阿里巴巴M工作室的负责人,开始研究各类高科技创新项目,设计AR、VR、机器人等产品。“他一直想打造真正的机器人,所以有了现在的若琪。如果今天你问他是不是做人工智能的,他最后还○是会跟你说——我是做机器人的。”

注:采访对象向文杰曾任阿里巴巴资深产品经理,CBO Tim曾在全球多家顶级广告公司任职。

上一篇: 智能电饭煲降低米饭含“糖”量 让你“放心”吃米饭
下一篇: 美国大选:60%智能手机用户通过手机应用进行选举投票