今日,好未來 CTO 田密在好未來 20 周年直播活動中宣布,好未來自研的數學領域千億級大模型 MathGPT 正式上線并開啟公測。即日起,用戶可通過官網申請注冊賬號免費試用體驗。
今年 5 月,好未來就曾公布正在進行自研數學大模型的研發,命名為 MathGPT。MathGPT 是面向全球數學愛好者和科研機構,以解題和講題算法為核心的數學垂直領域的大模型,也是國內首個專為數學打造的大模型。
(資料圖片僅供參考)
用戶使用 MathGPT 時,只需用文字或圖片方式上傳數學題,即可得到對話式的解答反饋,也可以通過 " 隨機來一題 " 的按鈕,隨機生成數學題目并由系統給出解答。目前,MathGPT 支持中文、英文版本的 PC 端和移動端體驗。
田密介紹,MathGPT 匯集了好未來多年教育教研數據積累,專注于數學領域。千億級大模型的訓練、推理、部署框架,為模型賦予了強大能力。通過優質教育數據,實現題目計算、講解、問答等多任務持續訓練和有監督微調,呈現出卓越表現。此外,借助人類反饋對齊,還將進一步提升模型綜合素養。MathGPT 在解題準確率、穩定性及用戶體驗方面均有明顯的優勢。
MathGPT 官網顯示,MathGPT 的數學計算能力已覆蓋小學、初中、高中的數學題,題目類型涵蓋計算題、應用題、代數題等多個類型,還可以針對題目進行追問,暫未開放數學之外的問答互動。
MathGPT 技術報告顯示,在 CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考數學和 Math401 等 6 個公開數學評測集合的測試結果中,好未來的 MathGPT 取得了多項測試的最高分數。同時,MathGPT 在 C-Eval 的初高中的全科測試集合上也均有不錯的表現。
在解題穩定性、講解友好度方面,MathGPT 基于名師解題過程的數據進行模型訓練,模型的解題步驟專業清晰。以一道數列題為例,MathGPT 給出的答案包含 " 分析 "、" 詳解 "、" 點睛 " 三個部分,比通用大模型的粗略講解方式更為細致," 分析 " 提供了題目的解題思路、思考方式,幫助用戶更好地理解題目," 詳解 " 則給出具體的計算方式和答案,最后 " 點睛 " 的環節,對題目的考點、難點、關鍵點進行提示,幫助用戶回顧反思出題意圖、舉一反三。
在 MathGPT 發布同時,好未來也在官網更新了一個具有代表性和挑戰性的數學任務評測集,供全球人工智能專家、數學愛好者體驗和測評。田密介紹,希望讓 MathGPT 在數學教育領域發揮更大作用,好未來愿意把基于大規模、高質量的內容的千億級大模型研發經驗方法和業內分享,和行業共同進步。
" 好未來在數學的數據和業務上有 20 年的積累,有大量的教育數據的積累和持續生產教育數據的能力,所以選擇做這個難而正確的事情。" 田密稱,好未來希望用自己在數學和 AI 上的多年積累,做好 AI 大模型時代的數學基礎工作。
2017 年,好未來成立了 AIlab 人工智能實驗室。基于智慧教育人工智能開放創新平臺助力,好未來 AIlab 獲得各類頂級學術會議比賽冠軍 16 項,亞軍 6 項,發表國際期刊和會議高水平學術論文近百篇。
2019 年,科技部宣布依托好未來建設智慧教育國家新一代人工智能開放創新平臺,好未來成為教育行業首批唯一一家人工智能 " 國家隊 " 成員,在人工智能領域有多年深入研究。多年來,好未來也在積極參與推動大模型標準體系建設,先后作為核心單位參與了由國家人工智能標準化總體組組織的大模型系列國家標準、中國信通院牽頭編制的 " 大模型預訓練模型技術和應用評估方法 " 系列團體標準,以及教育部教育信息化技術標準委員會暨全國信息技術標準化技術委員會主導的 " 教育通用大模型 " 系列標準編制工作。
近期,好未來正作為牽頭單位與中國信通院、復旦大學、科大訊飛、百度等行業領先科研機構、高校、企業一同編制教育大模型團體標準,從覆蓋場景、應用成效、服務可靠等維度全面評估教育大模型能力,為教育大模型應用落地提供參考與指導。
隨著大語言模型的興起,如何用 AI 技術服務各行各業是社會關注的焦點。教育行業是最早開始布局 AI 領域的行業之一,AI 能為教育生態帶來何種變化一直備受關注。
"AI 帶來了重新定義教育行業的機會,大模型技術使得大規模的因材施教真正有了實現的可能。" 田密認為,大模型的本質,是一種更高效的、從數據中學習知識并加以應用的方式。在 AI 能力的加持下," 學生自學 +AI 答疑 " 的新型學習方式成為廣泛的可能。學習者獲得優質教學內容的門檻、成本降低,獲得的教學內容個性化、精細化程度持續升高,可以實現千人千面的 AI 教學和答疑輔導,每個學生都能得到最適合自己的學習內容。
據田密介紹,隨著公測的順利進行,MathGPT 的解題能力將得到持續提升,基于 MathGPT 的產品級應用也正在加速研發中,將于近期發布。
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-24
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23
頭條 23-08-23