【大河財立方 記者 楊霄 文圖 實習生 郎潤乾】阿里云推出的AI新品“通義聽悟”,是不是另一個版本“訊飛聽見”?
6月1日,在廣州舉行的“2023年阿里云峰會·粵港澳大灣區”活動上,阿里云正式發布了工作學習AI助手通義聽悟。它是基于通義千問大模型擁有對語言更強的理解力,在開會、上課、訪談、培訓、直播、看視頻、聽播客等音視頻內容場景中,能記、能翻、能存、能劃重點。
【資料圖】
這意味著,在國內智能語音轉寫市場上,阿里云正試圖憑借新應用對科大訊飛既有優勢領域發起正面攻擊,用戶競爭與價格戰已經打響。而AI軟件是否會將智能錄音筆逼到出局?還有待考量。
AI產品戰在音視頻轉寫領域打響
“聽悟”能做線上會議“替身”
近兩年國內科技界AI技術開發熱,在音視頻轉寫領域率先結果。
當日活動現場,阿里云公布通義大模型進展,聚焦音視頻內容的AI新品“通義聽悟”正式上線。其稱,這是國內首個開放公測的大模型應用產品。
與當前市場銷售主流的智能錄音筆不同,阿里云“聽悟”作為一款獨立應用,不需要專業的錄音筆設備硬件做支撐,它可依托各類智能終端工作。換句話說,用戶手邊有什么智能設備均可,如有麥克風收聲硬件支持的手機、平板、PC等。
不過,阿里云新推出的“聽悟”顯然不只達到這個層級,它的核心功夫在于接入了通義千問大模型的理解與摘要能力,從而使它成為用戶工作學習中的得力AI助手,幫助用戶隨時隨地高效完成對音視頻內容的轉寫、檢索、摘要和整理。
例如,一名學生一天上8節課,每天放學后他要用智能錄音筆轉寫老師講述內容,再耗費數小時對翻錄文字糾錯,找到對應課堂重點內容,然后才梳理為課堂“筆記”。但“聽悟”不只是聽清語言內容,而是能聽明白語音后產生自我所“悟”。它超然于錄音筆的價值,是為音視頻劃分章節并形成摘要、總結全文及每個發言人觀點、整理關注重點和待辦事項。更甚者,聽悟還可能成為線上會議的參會“替身”,用戶在靜音情況下,入會AI可代其為全場會議記錄、整理要點,轉寫結果可下載為字幕文件,方便用戶在后期使用。
“換一種方式,讓音視頻可以被輕松閱讀、整理和分享。”阿里云CTO周靖人介紹,聽悟瞄準具有高知識附加值的音視頻內容場景,比如開會、上課、訪談、培訓、面試、直播、看視頻、聽播客等,能通過大模型等最新AI技術快速提煉和沉淀知識。同時,大模型一鍵提取PPT、針對多個音視頻內容向AI提問、概括特定段落等功能,近期也將上線。
另據了解,聽悟除個人版本外,還有企業應用。此前,聽悟企業版已在阿里集團內部被廣泛使用,幫助減少了大量會議記錄和整理的工作,受到職場工作者好評。同時,聽悟的能力也可嵌進各類音視頻平臺,形成實時字幕、智能摘要等,典型應用如釘釘的“釘閃記”背后便集成了聽悟。未來聽悟還將在夸克App、阿里云盤等端口提供服務。
錄音筆不會重蹈BP機覆轍
但AI技術之戰焦點是大模型
阿里云推出“聽悟”,瞄準了科大訊飛在國內智能語音轉寫市場的核心領地。
艾瑞咨詢發布的數據顯示,國內智能語音市場經歷了傳奇版增長的3年,從2019年市場消費規模約77億元,至去年增至159億元,并有望在今年增至215億元。該行業領域的核心競爭主體大抵有三類:以科大訊飛、搜狗為代表的專業智能語音企業,以阿里云、騰訊云為代表的云服務廠商,以網易為代表的專業轉寫或翻譯廠商等。科大訊飛無疑是當前市場最大的利益方,多年前其憑一招“智能錄音筆用戶享終身免費翻錄服務”,收割了記者、分析師、律師、HR、學生等大量市場需求。今天,科大訊飛在智能錄音筆領域的地位無人可及。
不過,阿里云推出“聽悟”的目的,絕不是打敗智能錄音筆,而是與科大訊飛的星火大模型做根本性較量。其聲稱,聽悟是國內首個開放公測的大模型應用產品。
什么是AI大模型?
事實上,國內科技圈對此仍缺少統一的標準定義,多對其作概括與描述。它是指具有數百萬或數十億個參數的深度神經網絡模型,這種模型經過專門的訓練過程,能夠對大規模數據進行復雜的處理和任務處理。AI大模型需占用大量的計算資源、存儲空間、時間和電力等資源來保證它的訓練和部署。而使用AI大模型,則需要數據收集、設計模型、模型訓練和測試,以及部署應用等。因而,AI大模型的競爭是算力、人才和資源的綜合競賽。
非科技圈人士,多對上述內容感覺生硬且燒腦。但任一科技公司創造AI技術的核心方向即是模仿人類,由此理解AI大模型的概念最為直觀。
今年,國內科技界在大模型領域的競爭堪稱急速沸騰。據不完全統計,2月復旦大學發布MOSS;3月清華大學發布ChatGLM-6B、百度發布文心一言;4月阿里云發布通義千問、知乎發布知海圖AI;5月,科大訊飛發布星火、騰訊發布混元、360發布360GPT。此外,還有傳聞中京東研發的犀利、華為研發的盤古NLP模型。5月31日,百度創始人李彥宏宣布啟動“文心杯”創業大賽,設立規模10億元投資基金支持生成式AI領域初創企業。
由此來看,阿里云在4月官宣的推出大語言模型“通義千問”,今日推出“聽悟”,相當于它先造好樹干,后生成樹杈。未來,它在“通義千問”樹干上會培育樹杈B、樹杈C,至樹杈N。不過,阿里云推出AI產品“聽悟”切入國內智能語音轉寫市場,是其早有該領域技術積累。
5年前,消費者所見最直觀的產品是智能音箱,如天貓精靈等,只不過相比當年技術系統完成了根本性迭代。而這,或相當于手機從模擬機變成了智能機。但另需看到,“聽悟”是在手機、平板等智能終端使用,其硬件條件決定了它無法擊敗中高檔錄音筆的專業收聲質量。所以,錄音筆或不會重蹈BP機的覆轍,但也會極大擠壓其用戶總量。
如上種種,足見各家科技公司在AI大模型領域的研發較量火熱。觀望后期,各家企業在AI大模型生成的應用產品必將面臨市場化,這無疑是一輪新的競爭熱點。
【文末彩蛋】阿里云“通義聽悟”正式公測,聯合大河財立方送100份20小時免費轉寫福利↓↓↓↓
責編:史健 | 審校:李金雨 | 審核:李震 | 監制:萬軍偉
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01