OpenAI一紙禁令,挑動了大模型行業的神經。但沒有什么阻礙,可以抵擋技術向上的決心。在不少大模型廠商開出優惠價格,試圖從OpenAI禁令中截流用戶的同時,國產大模型的代表企業科大訊飛,拿出了直面技術挑戰的勇氣。
6月27日,科大訊飛在北京國家會議中心舉行訊飛星火4.0發布會。在“懂你的AI助手”這個主題下,訊飛星火大模型不但在8個國際主流測試集中排名第一,實現了對GPT-4 Turbo的全面對標,還對商業化落地、生產力探索做出了更全面的闡釋,前瞻了行業的“Next-level”。
這一次,星火大模型掀起了新的巨浪。
自力更生,星火大模型成國產力量代言人
在國內外總共覆蓋中英文的12項主流測試集,訊飛星火大模型V4.0在其中8項全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。后面這三位,正是目前英文世界大模型的戰力天花板選手。
換一個指標,去年,科大訊飛參與設計了國產通用認知智能大模型測評體系,包含由481個測試項組成的7個方面。而如今,星火大模型V4.0在其中的文本生成、語言理解、知識問答、邏輯推理、數學能力五個方面超越了GPT-4 Turbo,僅在代碼能力和多模態能力上仍有一定差距。
不過從數據來看,文本生成(80.2%)、語言理解(82.3%)、知識問答(85.7%)、邏輯推理(82.2%)、數學能力(86.5%)、代碼能力(81.2%)、多模態能力(78.4%)這組數據放在一起,星火大模型V4.0總體已然算是國產大模型的能力代表。
具體來看,GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0,重點都放在多維度信息組成的復雜指令、更考驗邏輯任務能力的空間推理等高階能力上。根據科大訊飛發布會現場的介紹,星火大模型V4.0不僅在長文本等通用能力上整體打平GPT-4 Turbo,而且更加擅長利用已有資料進行聯系推理——比如解讀幾張有聯系的圖片的關系,為其補全內容情節,并減少“幻覺”的出現。
有趣的地方在于,星火大模型V4.0其實在多模態能力方面,實現了對GPT4-Turbo的部分超越,比如科研、金融、醫療、司法和辦公等專業領域的圖文識別能力。這代表星火大模型V4.0的側重點明顯不同于普通的通用大模型。它更側重于某些垂直領域的應用潛力。
對此,科大訊飛董事長劉慶峰在演講中做了一些闡述:“大模型不僅可以寫詩、作畫,在改變工業、改變科研范式等方面已經實實在在發揮作用,包括我們和中國科學技術大學做的合成類的科學創新,比如說化學;還有與合肥綜合性國家科學中心能源研究院合作,在推進大模型賦能核聚變整個過程中更快地預測、更好地應對各種各樣的異常情況。”
應用,已經成為星火大模型V4.0的重頭戲。只有真正用起來,能力才會有價值。
以訊飛星火APP為例,自2023年9月全面開放以來,訊飛星火APP在安卓公開市場累計下載量達1.31億次?,F在,全新升級的訊飛星火APP,允許消費者用自己的知識庫打造“更懂你的AI助手”。換句話說,專屬于個體的智能體。
按照劉慶峰在演講中透露的信息,訊飛星火APP使用的高峰期是工作日的工作時間段,意味著它真的變成了不少用戶的剛需。這是對“AI只能用來玩玩”的刻板印象的有力回擊,也是星火大模型價值的體現。
但更讓人激動的應用,其實還在蓄力。個人能從星火大模型中找到助手,企業乃至社會,將從中汲取更大的力量。這就是整個大模型產業的“Next-level”,它的亮點就在落地的最后一公里,以及那些暫時還是暢想的形式。
真正的Next-level,藏在最后一公里
幾個簡單的問題,可以讓我們對星火大模型V4.0的未來進化更有數。
首先,智能體為什么值得期待?九合創投在近日召開的年會上發布了《不朽的計算:比特連接世界,詞元生成未來》報告。其中提到,“模型是能夠沉淀智慧的計算形態”。傳統算法是數學結果,一次使用不具備普及性。但模型可以持續進化,適應多維度的使用需求。而封裝為智能體之后的超級模型,已經是特定領域的智慧結晶。它具有不可估量的復用價值。
以星火企業智能體平臺為例,科大訊飛已經首批創建了32個企業智能體,可以深入業務流程,滿足企業的需求。而這個過程其實非常輕松,企業只需要提出需求就可以開始創建智能體,經過功能驗證后,就可以真實上馬,并可以和企業內部辦公平臺打通。
從市場價值來看,訊飛星火大模型從去年發布到現在,已經和國家能源集團、中國石油、中國移動、交通銀行、大眾汽車、海爾集團、美的集團等行業領軍企業建立合作,證明其使用價值得到一線認可。
其次,為什么是訊飛?因為企業智能的底層除了大模型技術,還有對企業業務的理解,對分門別類的場景的認知,這不是坐在辦公室里就能拍腦袋想出來的。訊飛建立這些認知,花費了數十年的時間和遍布各行各業的具體嘗試。所以,智能體是新物種,但在訊飛和星火大模型的共同支持下,它會很快和現有生態相融。
換句話說,訊飛的領先,是星火大模型的技術領先和自身To B和To G業務領先的復合結果。2024年6月,訊飛剛剛榮獲國家科學技術進步獎一等獎,獲獎項目名為“多語種智能語音關鍵技術及產業化”,技術和產業化的雙劍合璧,成為一塊勛章。上半場的技術較量,訊飛能和OpenAI掰手腕。下半場的應用較量,訊飛更懂中國市場。
最后,星火大模型V4.0背后的進化,對智能體概念的探索,遠期價值恐怕會遠超普通人的想象。目前,還只是這個概念的蓄力階段。
一個很關鍵的問題是,從GPT-4 Turbo到星火大模型V4.0,我們越來越關注大模型的多模態能力、空間和邏輯推理能力、對復雜指令的理解和執行能力等等。這種需求引導下發展的大模型和智能體,注定用于和現實世界融合交互。
現代機器人之父羅德尼·布魯克斯(Rodney Brooks)在1991年發表的《沒有表征的智能》論文中提出,傳統智能基于復雜算法和內部數據模型是錯誤和片面的,真正的智能行為要從自主機器與環境的物理交互中產生。這個想法更加適合今天大模型和智能體的發展,或者說“具身智能”的概念——能理解和推理物理世界,并且產生互動。
“AI教母”李飛飛選擇的創業方向就是與之類似的“空間智能”。她曾在TED的演講上舉過一個例子——一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她說,人類大腦可以評估“這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關系”,所有推理都基于這些認知。
無疑,星火大模型V4.0也好,GPT-4 Turbo也罷,都是在朝著這種意義上的智能發展。
劉慶峰曾提出星火大模型的四條商業化路徑,其中一條就是基于“超腦2030計劃”推動機器人走進千家萬戶,重頭戲在于全棧機器人能力,而這又源于大模型的多模感知和多維表達。
對科大訊飛來說,好消息是它所掌握的應用經驗,很有可能讓星火大模型在向空間智能、具身智能的發展過程中步步領先。比如現在,星火個人智能體和企業智能體的落地,其實已經在調動現實要素對大模型和智能體進行完善。只不過,目前的應用停留在數字空間,還沒有深入現實進行交互。
但我們相信,這一天會比想象的更早到來。畢竟,從去年的星火大模型1.0版本到如今的4.0版本,科大訊飛從無到有,創造出世界一流的大模型能力和應用,已然是一個奇跡。
而在當下這個世界中,地緣層面的割裂已經影響到大模型世界的完整性。當OpenAI發出斷供宣言,有星火大模型這樣的一線玩家能夠頂上,不得不說是中國大模型產業的幸運。在這一年,中國人工智能領域的實力,正在這些領先者身上,閃耀著新的光芒。
來源:松果財經
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
每一輪技術浪潮出現時,沖在最前面的都是朝氣蓬勃的年輕人。當大模型代表的人工智能浪潮席卷全球,作為移動互聯網“原住民”的年輕開發者,可以說是最活躍的群體。他們的臉龐還有些稚嫩,但在技術和方向上有著自己的想法,在火熱的AI賽道里加速狂奔,努力打下一片新天地。面壁智能CTO曾國洋就是其中的佼佼者,26歲的
如果說2023年是大模型的資格賽,融資額度決定了能否晉級,2024年已然快進到了淘汰賽的階段。字節跳動、阿里云、百度智能云、騰訊云等先后在5月中下旬加入“價格戰”,輕量級模型直接免費,主力模型的API價格普遍下調了90%以上。曾經以“燒錢”著稱的大模型,迅速進入到“白菜價”時代。當時就有人提出這樣的
明知產能嚴重過剩的新能源企業卻還在重金擴產,多半因為他們花的不是自己的錢;明知極度燒錢的AI大模型卻開始打價格戰,多半因為他們并不靠這東西掙錢。所有投資人必備的一項技能,就是中觀行業景氣度及商業模式對比。很明顯,AI有很多的商業邏輯與其他行業非常相似。就比如:有實力的才能卷、免費的往往才是最貴的。打
“人工智能的商業模式,是要創造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執著于前沿技術的探索,后者則發力應用優化和商業化落地。南轅北轍的兩個方向,或許已經無法直接進行排位先后、優
智能體進化發展了一年,現在的RPAAgent迭代到什么程度了?從實在智能最新發布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現了流程全自動化AIAgent構建到執行全自動化,持續進化RPAAgent再次降低智能體應用門檻實在智能重磅發布實
崔大寶|節點財經創始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯的概念炒不動了,英偉達股價動輒暴跌重挫,引發“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節跳動宣布“以厘計費”,打響國內大模型
文|智能相對論作者|陳泊丞好消息!你心心念念的事業單位發錄取公告了!壞消息!他們沒錄你,錄了個數字人。圖片來源網絡隨著數字人技術的突破,越來越多的傳統企業和機構開始用上了“數字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數字人給捧上了。數字人捧上了“鐵飯碗”簡單翻看一下全國各地事業單位的“錄
黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業引發關注。據悉,近日地平線已通過中國證監會IPO備案,擬發行不超過11.5億股境外上市普通股并在香港聯合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供
8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態。據官方統計數據,今年現場逛展觀眾高達25萬人次,比去年增加25%。機器人行業有多火?看看2024世界機器人大會火爆程度便可知
瞄準場景需求,打造國內領先的自主可控、高質量超大載重高烈度環境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實力榮摘創業大賽一等獎這個比賽5年培育出16家“獨角獸”HICOOL2024全球創業者峰會暨創業大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個國家和地區的7406個創業項
人工智能是新一輪科技革命和產業變革的重要驅動力量。無錫市作為中國的科技創新中心之一,正通過構建人工智能"算力+算法+數據"三要素齊備的產業生態,為產業技術創新應用提供強大支撐,通過“AI+”行動推動人工智能與多個產業交叉融合,實現技術落地和產業化,加速形成新質生產力,打造具有國際競爭力的產業創新智造
近日,2024龍蜥操作系統大會(OpenAnolisConference)在北京圓滿召開,此次大會由中國計算機學會開源發展委員會、中關村科學城委員會、海淀區委網信辦、中國開源軟件推進聯盟指導,龍蜥社區主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進化