Anthropic 推出的更新使 Claude 支持語音對話,能查詢 Google 應(yīng)用數(shù)據(jù)并提供網(wǎng)頁搜索;此舉讓用戶在手機(jī)上享受更便捷、豐富的 AI 交互體驗(yàn)。
Amazon 推出了名為 Nova Sonic 的新型語音 AI 基礎(chǔ)模型,旨在讓第三方應(yīng)用開發(fā)者通過 Amazon Bedrock 平臺構(gòu)建實(shí)時、自然的對話式語音交互功能。Nova Sonic 整合了語音識別、語言處理和語音合成技術(shù),提供更流暢的人機(jī)對話體驗(yàn)。該模型支持實(shí)時雙向?qū)υ,可無縫集成其他系統(tǒng),并在多語言和噪聲環(huán)境下表現(xiàn)出色。
OpenAI 發(fā)布了 Advanced Voice Mode 的更新,這是一項(xiàng)能在 ChatGPT 中實(shí)現(xiàn)實(shí)時對話的 AI 語音功能。此次更新旨在使 AI 助手更加親和,減少對用戶的打斷。新版本允許用戶在說話時暫停而不被打斷,付費(fèi)用戶還將獲得更少的打斷和改進(jìn)的個性化體驗(yàn)。這一進(jìn)步反映了 AI 語音助手市場的激烈競爭,多家公司都在積極開發(fā)類似技術(shù)。
亞馬遜預(yù)計將于下周宣布對其語音助手 Alexa 進(jìn)行重大人工智能升級,這可能改變我們與這款流行智能家居設(shè)備的交互方式。升級后的 Alexa 有望具備生成式 AI 語音能力,能進(jìn)行更自然的對話并完成多步驟任務(wù)。這將是 Alexa 自 2014 年推出以來最重大的演進(jìn),可能重塑用戶與語音助手的交互方式。
近幾年,人工智能技術(shù)及應(yīng)用快速深入發(fā)展,智能語音、圖像識別等AI核心技術(shù)在推動產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型方面發(fā)揮出重要作用。其中,智能語音交互更是不斷取得突破進(jìn)展,為工業(yè)、教育、醫(yī)療、互聯(lián)網(wǎng)等行業(yè)優(yōu)化產(chǎn)品及服務(wù)體驗(yàn)帶來明顯優(yōu)勢。
經(jīng)歷了5年多的摸索,出門問問李志飛在昨天的2018戰(zhàn)略新品發(fā)布會上,第一次對外更新出門問問的公司定義,即出門問問是一家以語音交互和智能硬件為核心的人工智能公司。
3月22日,微軟(亞洲)互聯(lián)網(wǎng)工程院宣布率先推出新一代的語音交互技術(shù):全雙工語音交互感官(Full-duplex Voice Sense),并已完成產(chǎn)品化落地。