AI行業動態
Nvidia 和 Alibaba Cloud 合作預計將 Alibaba 旗下的大型語言模型 Qwen,搭載到 Nvidia 的 Drive AGX Orin 平臺當中。Drive AGX Orin 主要被應用於電動汽車的運算工作,例如路線規劃、環境偵測等,受到許多中國電動汽車製造廠喜愛。模型將會整合進下一代的 Drive Thor 平臺,用來實現駕駛員輔助、自動駕駛和 AI 駕駛員等功能。
刷題平台 CodeSignal 推出 AI Benchmarking Report,針對人類工程師與大型語言模型的 Coding 能力進行比較,當中也包含最新的 o1 模型!據圖可以發現普通工程師的 Coding 能力輸給了大多數的 AI 模型,包含常見的 GPT-4o 或 Claude Sonnet 等等。最頂尖的工程師在能力上,仍然能贏過目前最強的 o1 模型,雖然分數有逐漸接近的趨勢,卻也同樣展現出人類在 Coding 的強大能力!
Boston Dynamics 與 Toyota 研究中心達成合作,旨在加速類人類機器人的研發,並計劃將 Toyota 研究中心的大型行為模型 (LBM) 搭載到 Atlas 電動機器人中。隸屬 Toyota 的首席科學家 Gill Pratt 表示,該技術的未來前景十分可觀,Toyota 在生成式 AI 的研究成果,能與 Boston Dynamics 的核心技術相輔相乘,兩家公司的合作將聚焦於基礎研究,並最終進行商業運用
Nvidia 發表 Llama-3.1-Nemotron-70B-Struct 模型,是一款基於 Llama 3.1 70B 進行微調的開源模型,在某些基準測試當中,甚至優於 GPT-4o 和 Claude 3.5 Sonnet。該模型在幾個關鍵的測試,例如 Arena Hard、AlpacaEval 2 LC 和 GPT-4-Turbo MT-Bench 上,都拿到了當前的最高分!Nvidia 本次的成果,主要透過 RLHF 等高級機器學習技術實現,除了在 Hugging Face 上開源以外,Nvidia 也提供網頁版的預覽測試
法國的 AI 新創公司 Mistral AI ,近期推出了兩款「邊緣運算 AI 模型」,旨在為手機、筆記型電腦等邊緣設備,提供強大的 AI 功能。兩款模型皆來自新的 Les Ministraux 系列,分別為 Ministral 3B 與 Ministral 8B,官方基於研究用途,已透過 Hugging Face 平台公開 Ministral-8B-Instruct-2410,能支援中文等 10 種常見語言,只需提供個人資訊,便能獲得存取權
Midjourney 近期推出了網頁版的圖片編輯器,使用者們可以利用「文字提示」,進行圖片的修改、新增、甚至是拓展範圍等,非常有 AI 的感覺。新推出的 re-texturing tool 甚至能修改圖片中的光線與紋理,整個修改過程也不會影響到圖片本身的畫質
Meta 與路透社簽署多年協議,允許其在 Meta AI 聊天機器人中使用路透社的新聞內容,為使用者提供即時新聞和時事查詢的回答。這是 Meta 在 AI 時代達成的第一個新聞合作協議,從本週五開始,美國使用者在使用 Meta 整合於 Facebook、Instagram、WhatsApp 和 Messenger 的 AI 聊天功能時,將可以獲得來自路透社的即時新聞內容
繼發布Anthropic 的升級版Claude(它可以控制用戶的電腦並代表用戶自主執行任務)之後,據報道,Google還在開發一款人工智慧代理Jarvis,該代理可以“接管您的網絡”瀏覽器”,最早可能在 12 月發布。顯然是以漫威鋼鐵人的超級智慧人工智慧助理賈維斯(JARVIS)命名的,可以完成基於網路的日常任務,例如進行研究、購買和預訂航班。據傳由 Google 的下一代 LLM(Gemini 2.0)提供支持, Jarvis 通過捕獲計算機屏幕截圖並將其轉換為單擊按鈕或鍵入文本等任務來響應命令
中國众擎機器人是一間發展全球領先的通用機器人的公司,推出真人大小的通用人形機器人SE01,可以像人一樣走路方式。
Apple Intelligence上線嚕,當中也包含最新的 iOS 18.1 和 macOS Sequoia 15.1。使用者可以運用 Apple Intelligence 來完善自己的書寫內容;查看通知、郵件和訊息摘要;體驗更自然、更實用的 Siri(目前只有搭載 M1、A17 Pro 以上支持AI功能);用「清除」工具去除照片上的不相干物件;還有更多精彩功能。下一波更新預計於 12 月進行,也會帶來更進階的 AI 功能,例如:與 ChatGPT 的交互應用、Image Playground 和 Genmoji 等
《The Information》的報導,Meta 正在研發自家的 AI 搜尋引擎,希望能降低對 Google 以及 Microsoft Bing 的依賴程度。Meta 或許會將該搜尋引擎,應用於自家的聊天機器人 Meta AI 上,目前正利用網路爬蟲技術,大量搜集不同地資料來源
馬斯克的人工智慧新創公司xAI 為其人工智慧聊天機器人Grok 2 添加了影像理解功能,該機器人允許馬斯克社交媒體平台X(以前稱為Twitter)上的付費用戶上傳圖像並向Grok 詢問相關問題。Grok 可以確定圖像是什麼以及它來自哪裡,並根據要求進行詳細分析,甚至可以理解幽默元素並解釋笑話和模因
環球音樂集團 (UMG) 與人工智慧音樂製作新創公司 Klay Vision 合作,建立了一個名為 KLayMM 的商業“大型音樂模型”,以合乎道德的方式製作人工智慧生成的音樂。KLayMM 在短短幾個月內推出,將“與音樂產業及其創作者合作” ,並將“徹底改變人們對音樂的思考方式”,同時使音樂人工智慧“不僅僅是一個短暫的噱頭”
Grok2應用OCR完美的轉錄了難以識別的18世紀文檔(希望完美不是來自於預訓練的dataset!哈)
AI應用工具
Kolena:一個機器學習(ML)測試平台,旨在幫助機器學習團隊嚴格測試其模型行為。透過Kolena,團隊可以識別和追蹤失效模式,以提高模型的可靠性和性能。組織通常很難從大量非結構化資料(例如 PDF、電子郵件、合約等)中提取有意義的見解,此平台可將混亂的數據轉化為結構化的、可操作的見解,透過自適應人工智慧驅動的分析,Kolena 的平台可以釋放資料的潛力,簡化工作流程並提高業務清晰度。
Proxy:Proxy 是由倫敦 AI 新創 Convergence 打造的 AI 助手工具,號稱是「世界上第一款通用人工智慧代理」。可請 Proxy 幫你「預訂去巴黎的旅行」、「買 2 張最新的電影票」、「在 Linkedin 上發布新的職缺」、「安排會議行事曆」等。也可以根據自己的需求來訓練它,教它越多,它就越能理解你的工作流程,將你的重複工作自動化。
Beno:一個利用人工智慧的工具,能夠自動尋找並參與與您的產品相關的Reddit討論,並以自然的方式推廣您的產品。它的技術架構包括Svelte作為前端,Pocketbase作為後端,以及使用Python進行AI處理,涵蓋了一個複雜的LLM流程。
EbSynth:一款免費的Beta版工具,可用於將您自己的藝術風格應用於現有視頻,類似於旋轉繪製,但不需要為每一個幀都進行繪製。
Dynamiq:一個專為企業設計的綜合平台,旨在構建、部署和監控本地 GenAI 應用程序,以滿足業務需求、增加收入和提升競爭力。該平台還提供了一套全面的功能,幫助簡化 AI 應用程序的開發周期,包括快速原型製作、測試和部署等功能。
Life Note:MyLifeNote 是一款旨在提升創造力、加深自我認知、培養長期思維和增強精神實踐的日記應用。
Muraena:是一個AI增強的B2B潛在客戶生成平台,旨在簡化小型團隊和銷售發展代表(SDR)的潛在客戶來源過程,以加速尋找目標 B2B 潛在客戶。