作者:lexie
编辑:Lu
在关于 AI 的大讨论中,人们为其赋予的角色要么是我们最得力的高效助手,要么则是将颠覆我们的「机器军团」,不管是敌是友, AI 不仅要能完成人类布置的任务,还要能「读懂」人心,而这一读心能力也正是今年以来 AI 领域的重头戏。
在 PitchBook 今年发布的企业 Saas 新兴技术研究报告中,「情感 AI」成为了一大技术亮点,它指的是使用情感计算和人工智能技术来感知、了解和进行对人类情感的互动,试图通过分析文字、面部表情、声音和其他生理信号来理解人类的情绪,简单来说,情感 AI 就是希望机器能像人类一样,甚至比人类更好地「读懂」情感。
它的主要技术包括:
面部表情分析:通过摄像头、计算机视觉和深度学习,检测微表情与面部肌肉运动。
声音分析:通过声纹、语调、节奏识别情绪状态。
文本分析:借助自然语言处理(NLP)技术解读语句和上下文。
生理信号监测:使用可穿戴设备分析心率、皮肤反应等,提升互动个性化和情感丰富度。
Emotion AI
情感 AI 的前身是情感分析技术,它主要是通过文本互动进行分析,比如在社交媒体上通过文字进行用户情感的分析和提取,而有了 AI 的加持,整合视觉和音频等多种输入方式,情感 AI 承诺着更加精准和完整的情感分析。
硅兔君观察,情感 AI 的潜力吸引了众多投资者的关注,一些专注于这个领域的初创公司像 Uniphore、MorphCast 等,已经在这一赛道上获得了大量投资。
来自加州的Uniphore从 2008 年起就在探索为企业提供自动化对话解决方案,已经开发出包括 U-Self Serve、U-Assist、U-Capture 和 U-Analyze 等多个产品线,帮助客户通过语音、文本、视觉和情感 AI 技术进行更加个性化和情感丰富的互动。U-Self Serve 主打精准识别对话中的情感和语气,让企业能够提供更加个性化的服务,来提升用户参与满意度;
U-Self Serve
U-Assist 则能通过实时指导和工作流程的自动化来提高客服代理的工作效率;U-Capture 可以通过自动化的情感数据收集和分析,让企业拥有对客户需求和满意度的深度洞察;而 U-Analyze 则能够帮助客户识别互动中的关键趋势和情感变化,提供由数据驱动的决策支持来增强品牌忠诚度。
Uniphore 的技术并不仅仅是让机器理解语言,而是希望它们能在与人类互动时,捕捉和解读隐藏在语气、表情背后的情感。这种能力让企业在与客户互动时,不再只是机械化应对,而是能够更好地满足客户的情感需求,通过使用 Uniphore, 企业的用户满意度能够达到 87%,客服表现提升 30%。
Uniphore 至今已经完成了超 6.2 亿美元融资,最近一轮投资来自于 2022 年由 NEA 领投的 4 亿美元,March Capital 等现有的投资者也进行了参投,此轮后估值达到了 25 亿美元。
Uniphore
Hume AI则推出了世界上第一个能够共情的语音 AI,由前 Google 科学家 Alan Cowen 创立,他曾以开创了语义空间理论而出名,这一理论通过揭示声音、面部和手势的细微差别,来理解情绪体验和表达,Cowen 的研究成果发表在「自然」和「认知科学趋势」等众多期刊上,涉及迄今为止研究范围最广、最多样化的情绪样本。
以此研究驱动的 Hume 开发出了对话式语音 API - EVI,它结合了大型语言模型和同理心算法,能够深入理解和解析人类的情感状态,它不但能识别语音中的情感,还能在与用户的互动中做出更加细腻和个性化的反应,而开发人员只需几行代码即可使用这些功能,并可将其内置到任何应用程序中。
Hume AI
当前大多数 AI 系统的主要限制之一在于它的指令主要由人类给出,这些指令和提示容易出错且无法挖掘出人工智能的巨大潜力,而 Hume 所开发出的共情大型语言模型 (eLLM) 能够根据上下文和用户的情绪表达调整其使用的词语和语调,通过将人类快乐作为第一原则进行机器的学习、调整和互动,在心理健康、教育培训、急救呼叫、品牌分析等多个场景中都能为用户带来更加自然和真实的体验。
就在今年 3 月,Hume AI 完成了由 EQT Ventures 领投的 5000 万美元 B 轮融资,投资方还包括 Union Square Ventures、Nat Friedman & Daniel Gross、Metaplanet 和 Northwell Holdings 等机构。
在这一领域的还有专门衡量消费者认知和情感反应的Entropik,通过 Decode 这一融合了情感 AI、行为 AI、生成 AI 和预测 AI 综合力量的功能,它能够更好了解消费者的行为和偏好,从而提供更个性化的营销建议,Entropik 最近在 2023 年 2 月完成了 2500 万美元的 B 轮融资,投资方包括 SIG Venture Capital 和 Bessemer Venture Partners。
Entropik
科技大厂凭借自身优势,在情感 AI 这一领域也有所布局。
包括Microsoft Azure认知服务的情感 API,能够通过分析面部表情和情绪,来识别图片和视频中的喜悦、愤怒、悲伤、惊讶等多种情绪;
IBM Watson的自然语言理解 API 可以处理大量文本数据,识别出背后的情感倾向(如积极、消极或中性),来更精准的解读用户意图;
Google Cloud AI的 Cloud Vision API 拥有强大的图像分析功能,能够快速识别图片中的情绪表达,且支持文字识别和情绪关联;
AWS 的 Rekognition也能够检测情绪、识别面部特征并追踪表情变化,还可以与其他 AWS 服务结合使用,成为完整的社媒分析或情感 AI 驱动的营销应用。
Cloud Vision API
有些初创公司在情感 AI 领域的研发脚步更快,甚至到了科技巨头都要「挖人」的地步,比如独角兽Inflection AI就被投资方微软看中了 AI 团队和模型,微软在与 Bill Gates、Eric Schmidt 和 NVIDIA 等多方共同为 Inflection AI 投下了 13 亿美元后,向 AI 领军人物也是 Inflection AI 的联合创立者之一 Mustafa Suleyman 抛出橄榄枝,随后 Suleyman 连带 70 多位员工转投微软,而微软也为此支付了近 6.5 亿美元。
不过,Inflection AI 也很快重整旗鼓,组建了来自拥有谷歌翻译、 AI 咨询和 AR 多个背景的新团队,继续在其核心产品 Pi 上持续发力。Pi 是一款能够理解并回应用户情感的个人助手,与传统的 AI 不同,Pi 更加注重与用户建立情感连接,通过分析语音、文字等输入感知情绪,在对话中展现出同理心。Inflection AI 将 Pi 视为教练、知己、倾听者和创意伙伴,而不是简单的 AI 助手。此外,Pi 拥有强大的记忆功能,能够记住用户的多次对话历史,以此来提升互动的连续性和个性化体验。
Inflection AI Pi
虽然情感 AI 寄托着我们对更加人性化互动方式的期许,但就像所有的 AI 技术一样,它的推广更伴随着关注和质疑。首先,情感 AI 是否真的能够准确解读人类的情感?在理论上,这项技术的确能够使服务、设备和技术的体验更加丰富,但从现实的角度来看,人类的情感本质上是模糊和主观的,早在 2019 年就有研究人员曾对这项技术提出质疑,表示面部表情并不能可靠的反映人类的真实情感,因此单纯依赖机器来模拟人类的面部表情、体态和语调来理解情感, 存在着一定的局限性。
其次,严格的法规监管也一直是 AI 发展路上的绊脚石,比如欧盟的 AI 法案禁止在类似教育等领域使用使用计算机视觉情感检测系统,因此可能会限制某些情感 AI 解决方案的推广;像是美国伊利诺伊等州也有法律禁止在未获许可的情况下进行生物识别数据的收集,这就直接限制了情感 AI 某些技术使用的前提。同时,数据隐私和保护更是一个重要问题,情感 AI 通常应用于教育、健康、保险等对数据隐私要求格外严格的领域,因此确保情感数据的安全和合法使用,是每一家情感 AI 公司都需要面对的课题。
最后,不同文化地域的人与人之间进行交流和情绪解读都是难题,对 AI 来说更是考验,比如不同地区对情感的理解和表达方式各不相同,这可能影响情感 AI 系统的有效性和完整性,此外,情感 AI 在处理种族、性别和性别认同偏见时,也可能面临不小的困难。
情感 AI 不仅承诺着减少人力的高效,还有着读人心的体贴,但它是否能够真的成为人类互动中的万能解决方案,还是会成为和 Siri 大同小异的智能助手,在需要真正情感理解的任务中表现平平?或许在未来,AI 的「读心术」将会颠覆人机甚至是人类互动,但至少在现在,真正理解和回应人类情感,或许还是更需要人的参与和审慎。