用了“Apple智慧”一週,我發覺蘋果並不在乎“遙遙領先”

2024-11-02 01:37:05 4

如果你有關注十月的手機新品釋出會,那你或多或少有聽到過“比果更果”、“果味十足”這些詞。

這個說法源於 2024 年第四季度,從九月到十一月釋出的這批國產旗艦手機所搭載的 AI 大模型功能中,或多或少都涉及到畫素級致敬蘋果在 iOS 中內嵌的 AI 能力框架——Apple Intelligence 的設計;其中有些實在是與蘋果過於相似,因此在相關的體驗內容中,類似的評語層出不窮。

但比起你爭我趕的模仿者們,反而是蘋果在最先介紹了 Apple Intelligence 要釋出哪些功能之後,重新迴歸沉寂——即使目前公開的功能中,其實並沒有太多新鮮的內容。這些都直到上週釋出的 iOS18.2 Beta 測試版中,AI 才算揭曉帷幕,並在北京時間 10 月 29 日凌晨,正式版 Apple Intelligence 隨著新 iMac 一起釋出,推送給大多數普通 iPhone 使用者。

目前,Apple Intelligence 的中文譯名為“Apple 智慧”,在中國官網的介紹目前還是“為 Apple 智慧預備好”,庫克也在近期多次吹風,表示國行版 Apple Intelligence“即將到來”;眼下 Apple Intelligence 相關功能也不支援中文:對中文的支援將在明年正式釋出。

Apple Intelligence 設定介面|圖片來源:極客公園

一、Apple Intelligence 上手

之所以說本次更新才是 Apple Intelligence 的正式亮相,是因為其推送的更新,其實全部都是 iPhone16 釋出會上已經介紹過的內容,現在才終於將釋出會上關於 Apple Intelligence 畫的不少餅,端出來給使用者。

由於 Apple Intelligence 對裝置記憶體有著更嚴格的要求,因此目前只有搭載 8GB RAM 的 iPhone 才能使用——這意味著只有 iPhone15 Pro 以及 iPhone 16 全系。

對於 iPhone 16 系列,本次更新最重要的一個“硬體更新”,是原本設計用於相機縮放/光圈等功能控制的側邊按鍵,現在只需要長按,就可以啟動 iOS18.2 新增的“視覺智慧”功能。

此前一直只存在於傳聞中的“iPhone AI 按鍵”,此次更新後才算正式落地,雖然 AI 專屬按鍵這個概念也已經不再新鮮。

iPhone 16 的側邊相機控制按鍵,此時才終於變身“AI 按鍵”|圖片來源:極客公園

在過去一週我的實際使用中,影象識別這部分功能是目前 Apple Intelligence 對於中文使用者體驗最友好的一部分:即使識別的原文是中文,也能準確地理解其中的內容,並判斷出其中的電話、地址、日期時間等元素,搭配系統 App 實現基礎的自動化服務:如果是地址可以自動跳轉進地圖 App,日期/時間可以一鍵在日曆中生成對應事項、電話自動跳轉到撥號頁面等。

影象識別功能|圖片來源:極客公園

在拍攝完成後,你還可以藉助整合 ChatGPT 的 Siri 提問,Siri 能夠準確地識別出你拍攝的各種中文資訊,並且給出諸如“這個展板介紹了什麼內容”這樣問題的回答。

影象識別透過 ChatGPT 給出的識別內容反饋|圖片來源:極客公園

對於類似手機殼這樣的商品內容,點選搜尋按鈕後,會自動抓取電商平臺中相關商品的連結,同時起到介紹物品細節以及購買的作用,屬於是一步直達了。

自動識別內容並從電商平臺抓取相關商品|圖片來源:極客公園

按照蘋果的介紹,今年十二月,蘋果還將圍繞影象識別功能,加入多模態能力的整合:例如快速幫使用者熟悉地點周圍的風景,以及餐廳評分以及當天推薦特色菜品之類的服務。這個能力未來也將開放給第三方 App。

當然,以上的互動回答目前都還是以英文為主——即使 ChatGPT 本身顯然是支援中文並且能夠直接輸出中文內容的,當前的 Apple Intelligence 也不能使用中文來回復

本次更新還加入了系統級的文字大模型能力,除了之前已經在 iOS18 中已經出現過的通知要點總結,郵箱自動整理郵件緊急排序等功能,在系統自帶的備忘錄中,現在還加入了 AI 最佳化相關的選項,除了推薦的幾個改寫方向,你還能直接提出你的要求,讓備忘錄幫你自動生成一份文稿。

iOS18.2 備忘錄中的寫作工具|圖片來源:極客公園

當然,這個功能目前也不支援中文:即使它呼叫的 ChatGPT 處理類似的中文需求時已經非常遊刃有餘;另外蘋果還宣佈過這個功能的“完全體”將會在十二月釋出,屆時能處理包括“幫我將晚會邀請改寫為一首藏頭詩”、“幫我風格化處理我的簡歷”之類的複雜需求。

對了,如果你是尊貴的 ChatGPT 付費訂閱使用者,現在蘋果還在設定中提供了一個介面,可以用於登入你自己的 OpenAI 賬號,獲得更多模型的使用許可權;當然免費版使用者也能在與 Siri 的對話中呼叫 ChatGPT 能力。

iOS18.2 中還新增了一個名為 Playground 的 App,其中收納了 iOS 當前所有關乎於影象生成相關的功能,例如使用 Apple Pencil 進行粗略的手繪草圖,並讓 Image Wand 將其轉換成更精美的影象;Genmoji 顧名思義,就是藉助於大模型能力,實現的繪製類似 Emoji 效果的頭像,並以 Emoji 的方式來分享。

Playground 影象生成功能|圖片來源:Apple

聽起來很美好,但目前 playground 需要使用者在系統級的 Beta 系統更新之外,單獨申請這個 App 的測試權;這種“測試版裡內嵌測試版”的套娃體驗,在過去的蘋果軟體服務中並不多見,不少海外使用者也吐槽“申請之後 N 天了還沒透過”。

不過倒也不用太過著急,蘋果官方宣佈的訊息,Playground 的測試申請會在“未來數週內”逐步透過當前使用者的測試申請。

雖然整合了 ChatGPT,但 Siri 本身“弱智”其實改善並不明顯:準確來講整合了 Apple Intelligence 後的 Siri,在請求語言的理解以及上下文的連續對話能力部分,相比此前還是有明顯提升的,只是近兩年我們過去已經看過眾多包括 ChatGPT 高階對話模式這樣一次次震驚世界的大模型連續對話體驗,如今“升級”過後的 Siri,在綜合體驗上落後於同類產品。

ChatGPT 高階對話模式|圖片來源:極客公園

在對話中,當你提出的問題涉及到呼叫 ChatGPT 能力時,SIri 會彈出一個確認,當然你也可以在設定中關閉這個確認請求的選項,但這個過程仍然等同於直接將你的問題“抄送給 ChatGPT”。

“抄送給 ChatGPT”|圖片來源:極客公園

圖片內容識別上,當前的 Siri 訓練資料庫仍然存在檢索能力匱乏的問題:我拿起手機拍我的愛車,並問 Siri“這是什麼車”,Siri 也能自動呼叫 ChatGPT,給出一個對話結果,告訴我“這是一輛藍色的斯巴魯 Levorg”。

iOS18.2 影象識別能直接以對話的方式給出結果|圖片來源:極客公園

但這其實並不是正確的車型識別結果:同樣的問題,即使是問已經發布數年、當時“多模態”這個概念還不被世人所知時釋出的 Google Lens 智慧識圖,都能給出更加準確的關聯識別結果:告訴我這其實是一輛力獅而非外觀接近的 Levorg。

綜合來講,在概念上並無太多新意的 Apple 智慧,比起今年十月釋出的、隔壁 vivo 藍心小 V 以及“畫素級致敬 Apple Intelligence”的 OPPO ColorOS15,如今的姍姍來遲的正式版 Apple Intelligence,反而更像是“後來者”。

“體驗倒掛”成為了 iOS 與當前其他強調 AI 的智慧手機作業系統,甚至是獨立 App 之間的對比中的常態。

那蘋果在 AI 領域的“首輪競爭”,真的止步於此了嗎?

二、保守的背後

有 ChatGPT 珠玉在前,Siri 當前展現出的“低能”,顯然並不能簡單理解為技術上遇到了難題:甚至在體驗上 ChatGPT 本身都能實現的能力,當前的 Apple Intelligence 都不支援。

蘋果的“保守”,或許可以被理解為蘋果對於新技術一貫的“謹慎”,不僅不急於拓展 AI 能力在智慧手機上的邊界,還在主動為 AI 設定圍欄。

不僅在備忘錄中的 AI 改寫功能中,對於改寫寫作風格的調性偏向保守;在用於建立風格化自定義影象的 Playground 中,使用者很明顯就能察覺到它與其他大廠釋出影象生成工具的不同之處:它完全無法像今年爆火的預訓練影象生成模型 Lora 那樣,用於生成那些和真人幾乎無異、讓人真假難辨的影象。

Playground 生成 Genmoji 效果|圖片來源:Apple

實際上這種謹慎不無道理:即使多模態大模型已經出現幾年,但包括內容幻覺、AI 生成內容用於犯罪,都是當下伴隨著大模型應用“矇眼狂奔”伴隨而來的問題,近年來 AI 生成的虛假內容充斥網路。

除了內容氾濫,如何保護使用者的私有資料,在 AI 時代也成為了一個重要的命題:不少創作者也因為擔心自己的素材被拿去訓練,在網路上變得謹小慎微;這些現象都說明了當前對於 AI 內容的監管,一直處於嚴重缺位的狀態。

早在 Apple Intelligence 釋出之前,蘋果就已經著手進行了“圍欄”的搭建:今年九月,Apple 邀請隱私和安全研究人員測試蘋果宣佈的“私有云計算”對於使用者資料隱私的保護承諾。同時致力於建立對虛假內容的安全宣告機制,向著建立 AI 虛假內容的公共問責機制邁出一步。

在硬體上,為了更好地服務 Apple Intelligence,蘋果已經啟動了全系硬體產品的升級換代:不僅 iPhone16 記憶體全系升級至 8GB,在十月正在更新中的新款 Mac 產品線陣容,也終於把牙膏擠爆,記憶體全系 16GB 起跳,為了支援端側 Apple Intelligence 模型能力的應用。

新 iMac,全系 16GB 記憶體起步|圖片來源:Apple

在硬體之外,面向開發者的趁手工具也已經在路上:在 iOS18.2 Beta 測試版釋出後,蘋果隨即更新了三個關鍵 Apple Intelligence 功能的 API:編寫工具 API、Genmoji API 和 Image Playground API。

這三個 API 介面,都旨在幫助開發人員將 Apple Intelligence 整合到他們的應用程式中,換言之:隨著越來越多這樣的 API 介面加入,開發者都能夠在所有 Apple 生態的硬體裝置上呼叫端側模型計算能力,無需額外的伺服器成本,加上當前 Apple 生態數以億計的使用者,這無論對於中小開發者還是巨頭來講都是一項極具誘惑力的條件。

由此可見,蘋果的第一方應用目前並不謀求短暫的效果取勝,而是透過構建軟硬體深度整合、搭建原生 AI 硬體生態平臺的方式,為開發者提供一個適合 AI 時代超級 App 生長的土壤。

這些問題,與其說是隻有蘋果邁出了第一步,不如說這是長期來看,只有諸如蘋果、華為這樣,有自有生態/硬體以及掌控能力的廠商,才有機會參與的深度競爭;擁有生態的平臺級的玩家,與只有“硬體製造商”單一標籤的廠商,或許從這場競爭的一開始,就拉開了巨大差距。

AI 時代智慧手機競賽這場“馬拉松”中,並不只有一開始就“全力衝刺”這一個選項。