大模型重塑智慧硬體！人手一個智慧助手的時代來了？

2024-11-02 01:35:54 4

作者 | 徐豫

編輯 | 漠影

在生成式AI浪潮的影響下，智慧硬體開始出現全新的人機互動體驗。

AI智慧助手更有針對性地實時解答你的“十萬個為什麼”；AI卡片錄音機能幫你實時轉寫會議內容，還隨手就羅列好了會議總結、要點分析和待辦事項；AR眼鏡戴上後就能看到文字、圖片、影片中的實時多語言字幕；智慧門鎖會根據來訪人士定製主人的聲音，模仿你的聲音取快遞、拿外賣，或者改變聲音語調以恐嚇無關逗留人士；毛絨小熊真的成為孩子的知心朋友，可以一起聊聊煩惱、疑惑和心事……

可以預見，更智慧化的多模態大模型賦予了智慧硬體新的生命。

戴在臉上的影院！雷鳥Air 3再破AR眼鏡價格下限，1699元開售

就在上週六，RTE 2024第十屆實時網際網路大會IoT分論壇圓滿結束。多位AI智慧硬體賽道的資深人士齊聚一堂，共同探討如何讓“智慧硬體產品們”迎頭趕上AI的好時代。聲網IoT行業負責人吳昌儒、曠視增值業務部負責人史澤鴻，海馬爸比聯合創始人譚國豪、佐臻科技技術經理徐偉恩、小米Xiaomi Vela開源負責人杜超、蓮偶科技軟體部總裁楊旺分享了他們在打通AI與智慧硬體屏障方面的實戰經驗。

一、AI驅動多模態互動，人機互動更自然

在傳統的硬體裝置中，人機互動大多透過按鍵、觸控式螢幕等圖形使用者介面（GUI）來完成。但隨著AI技術的引入，尤其是對話使用者介面（CUI）的崛起，使用者可以透過語音、視覺、手勢等多種方式與裝置進行互動，帶來了更加自然、直觀的互動體驗。

“AI驅動的智慧硬體不再單純依賴固定的功能按鈕或選單，而是透過對使用者意圖的理解，圍繞使用者想要完成的任務進行設計。”聲網IoT行業負責人吳昌儒舉例說道，智慧家居中，使用者僅用一句話便可觸發多個裝置的聯動，說出“我要看電影”，AI系統隨之做出自動調節燈光、開啟電視、調整空調溫度等操作。這種基於任務導向的設計，讓使用者體驗更為絲滑和智慧，大幅減少了手動操作的繁瑣。

住著一個AI Agent的智慧硬體不用再孤立工作，而是能夠與其他智慧硬體之間形成互聯，彼此協作。也就是說，每個裝置中的AI Agent都能獨立執行特定任務，同時也能根據需求與其他AI Agent協作，整體上是一個複雜且靈活的智慧系統。

現場，其他與會嘉賓也圍繞各自產品或業務在AI方面的落地各抒己見。

長期以來，AI與AR的結合都是智慧眼鏡的理想答案。對於聽音樂、拍影片、翻譯等需求，不少市面上在售的AR眼鏡都基本能滿足，佐臻科技則為AR眼鏡找到了更多個性化的應用場景。

其最新款的AR眼鏡不僅適用於跌倒檢測、呼吸監測等看護場景，還可以滿足AI或XR多人混合實時互動算繪場景的需求。也許在不久的將來，只要一副AR眼鏡，人們就能遠端觀展、跨國雲旅遊、多語言同聲傳譯、實時共享影片、異地協同檢視雲端檔案和3D模型。

戴在臉上的影院！雷鳥Air 3再破AR眼鏡價格下限，1699元開售

按照徐偉恩的設想，裝備了AI引擎的AR眼鏡未來將即時提供更多個性化的反饋。舉個例子，你佩戴著AI眼鏡，剛好路過了一輛停在路邊的車，你多看了幾眼這輛車的Logo，AI眼鏡會猜到你可能對這個汽車品牌感興趣，隨之提供相關的資訊。值得一提的是，這種呈現資訊的方式是私人化的，可以降低人們對資訊共享的顧慮。

在徐偉恩看來，聲網的語音互動技術充當了AI智慧硬體實時人機互動的關鍵神經元。而AI智慧硬體只有真正實現隨時隨地呼叫資料、與人互動、與環境互動後，才能與真實生活串聯起來。

當底層的語音技術還較為稚嫩時，人們很難想象手上一枚小小的戒指，也能將AIoT的風吹到直播出海這一領域。

蓮偶科技最新的空間戒指TOALL L-Ring 2透過多模態大模型落地了錄音轉寫、AI對話、同聲傳譯等功能，有助於人們在直播、講課件、播放PPT、看電視以及駕駛過程中儘可能解放雙手。未來，外貿主播在直播過程中，戴上它“揮揮手”就可以完成口型影片合成、情緒模擬、聲紋模擬、語音合成等，從而同步、同時生成多語種的直播間。

戴在臉上的影院！雷鳥Air 3再破AR眼鏡價格下限，1699元開售

水準較高、穩定可靠的實時AI語音互動技術，可謂是AIoT的強心劑。AI智慧硬體若能及時語音反饋危險情況，在關鍵時刻或許能“救命”。

基於高精度的資料訓練，海馬爸比的嬰兒看護機可以實時監測嬰兒的睡眠情況和哭聲，判斷嬰兒是否“遮臉”，並針對可能窒息的情況做出提醒。海馬爸比聯合創始人譚國豪告訴智東西，有了AIoT智慧硬體技術的加持，新一代的嬰兒看護器對嬰兒哭聲、狀態的識別更敏感，可以及時發現吐奶等其他可能引發窒息的情況。現在，AI智慧硬體或許比新手爸媽更能聽懂嬰言嬰語。

戴在臉上的影院！雷鳥Air 3再破AR眼鏡價格下限，1699元開售