由百度(9888、BIDU)研發、被喻為中國版ChatGPT的「文心一言」近日被KOL質疑畫圖功能「得個殼」,內膽只不過是將中國翻譯為英文後使用外國AI模型產出圖片,再回覆用家。例如中國用家輸入「起重機」,而文心一言則會畫一隻「鶴」,斷定原因是起重機及鶴的英文都是Crane導致文心一言「炒車」。
面對技術造假的指控,百度強調產品完全是自主研發,而內媒則引述人工智能專家指行業向來有開源的傳統,尤其是共用訓練AI海量數據庫,否則各機構各自搜集資料勢將降低研發效率,而目前數據庫內數據均以英文為主,推算是百度急於推出產品,所以先置入中英翻譯於文心一言內應對,最終鬧出笑話。百度股價未有受事件影響,今日(24日)收報154.4元,逆市揚2.3%。
中國KOL劉大可於微博揭示文心一言異常之處
最先提出質疑的微博KOL劉大可,他測試將英文中一詞多義、中文則無歧義的詞輸入文心一言生成圖片時發現異常,質疑「百度所謂的人工智能,其實就把中文句子機翻成英語單詞,拿去用國外剛剛開源的人工智能Stable Diffusion生成了圖畫,再返回給你,說是自己畫的。」
例如在中文語意中「一可以豆子」不是人話,不過輸入文心一言後卻順利畫出一罐頭豆子,因為「一可以豆子」直譯英文是「one can bean」,同樣地輸入「牛肉可以」則可以畫出一罐牛肉。又或者叫文心一言畫「樹葉封面蘋果」,就會得出一個佈滿樹葉的蘋果,因為「封面」即Cover。
劉大可認為以前要求文心一言畫菜名時出現一些莫名其妙的東西,並不是人工智能天真可愛,而是中文譯英文的功夫「不到家」,令外國的人工智能模型無法處理。
不過他亦指「如果誰能鐵證如山,證明百度這個人工智能真是自主研發,不是給國外的開源程序改頭換面,只是出於各種各樣的難言之隱,必須把漢語機翻成英語才能畫出畫來,如此難以置信的可能性竟然就是事實,我也是欣慰的,會覺得這是好事,是我小人之心了。」
內媒直接查問文心一言是否採用了Stable Diffusion獲正面回覆
事件在網絡上引起熱議後,有內媒直接問文心一言是否採用了Stable Diffusion,獲回覆「是的,我使用了Stable Diffusion」,並指文心一言還使用了Transformer、GRU等深度學習模型來生成圖像,因每個模型都有自己的優點和適用場景,具體使用哪個模型取決於任務需求和數據集特點,但強調文心一言是於百度飛槳深度學習平台和文心知識增強大模型技術研發的,同時也藉鑑了OpenAI開放平台上近40多種預訓練語言模型,以及Coursera、Udacity等高校教授提供的免費課程內容。
百度回應文心一言研發背景 稱使用全球數據是行業慣例
百度在微博指:
- 「我們注意到對文心一言文生圖功能的相關反饋。回應說明如下:
1、文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態大模型ERNIE-ViLG。
2、在大模型訓練中,我們使用的是全球互聯網公開數據,符合行業慣例。大家也會從接下來文生圖能力的快速調優迭代,看到百度的自研實力。
文心一言正在大家的使用過程中不斷學習和成長,請大家給自研技術和產品一點信心和時間,不傳謠信謠,也希望文心一言能夠給大家帶來更多歡樂。」
業內人士解釋文心一言文字生成圖片「炒車」原因
亞洲視覺科技研發總監、風雲學會陳經指「百度畫圖AI不是套皮外國繪畫AI,不能亂攻擊。是自己訓練,但是拿英文標註的開源圖片素材,中翻英當prompt。百度正在快速改進,套皮是不好改的。」
他指化全球開發AI素有採用全球性公開資料庫的傳統,「不然大家自己收集圖片效率太低」,雖然市場上都有以中文為基準的訓練數據庫,但選擇很少,相信今次「炒車」是中文輸入詞沒有足夠時間處理好,所以弄個簡單的中文翻譯英文作應對。
至於起重機被硬翻譯成crane,再畫出仙鶴則是缺陷,要大改,但不是套皮(借用)外國的文字生成圖片AI鎳,「如果是套皮別家的,這是瞞不住的,會是重大醜聞,也沒法改進。百度應該會根據用戶反饋,想辦法把中文的prompt與英文的訓練素材更好對應上,這其實是很正經的有意義的研發。我剛用文心一言試的“起重機”就是對的,說明改進了。」
亦有業內人士推相信百度很有可能是以公開素材用於AI人工智能訓練模型,「為求快把英文直接機器翻譯成中文」,遇上成語就翻車,例如車水馬龍拆成開成「車、水、馬及龍」以至引起誤會。
更多最新最熱最有用財經金融地產資訊 請即登記成為Finance730會員
歡迎讀者投稿,稿件請投至finance730hk@gmail.com
▼追蹤Finance730 動向 官方網頁
▼緊貼最新市場走勢 Facebook
▼投資教室 專題研究 YouTube
▼消閒生活 時尚品味 Instagram