吉報 @ 10W3

20241024

Oct 24, 2024

令人振奮的匿名投票結果！發起AI週更“吉報”約半年時間了（前期在線上文檔中分享，後期建立電子報），首次在讀者內進行匿名（真匿名）投票：
所有人都有閱讀吉報！
37.5%把吉報每週內容全部看完
62.5%挑選與業務相關的內容閱讀
大家都覺得閱讀吉報，每週可從中獲取AI資訊有正向幫助，無負項反饋
53.8%最大比例表示因此更了解行業時事
三項相同得分各佔15.4%，分別是認為因此更具備創造性、更想玩AI，以及發現更多有趣的AI工具可以嘗試

AI行業動態

Sam Altman 創辦的World Network推出了新一代虹膜掃描設備 Orb，提供更完善的身份驗證系統。新的 Orb 更容易大規模生產，零件更少，運行速度提高三倍，更與物流公司 Rappi 合作，直接上門為客戶提供「虹膜掃瞄」服務！World 也公布新的 World ID 3.0 協定，透過新提供的 World ID 憑證，打擊日益猖獗的 Deep Fake 問題
Rhymes AI 推出全新多模態 MoE 模型 Aria，根據官方提供的測試結果，Aria 在文件與圖表理解的能力上特別突出，一度超越了 Llama-3.2 和 GPT-4o。在 DocVQA 測試中，Aria 達到了 95% 的準確率，超越了 90% 的 GPT-4o，而在 ChartQA 測試中，則以 3% 的差距略輸給 GPT-4o。Aria 的參數規格達到 3.9B，並且支援 64K 的 Context Window，目前該模型已開源HuggingFace
Northwestern University 的研究團隊，近期推出了名為 MobilePoser 的應用程式，能透過智慧型手機、手錶、無線耳機等常見設備，捕捉人類的行為動作。透過 IMU 以及先進的 AI 演算法，MobilePoser 能在沒有任何專業設備的前提下，完整追蹤人類的關節位置、旋轉角度，甚至是走路的速度等等。

xAI 的 API 正式上線啦！未來的開發者們將可以透過 API，將 Grok 語言模型串接到自己的應用程式當中。根據官方的介紹，這支 API 能提供了兩款多模態語言模型，分別是 Grok-2 以及 Grok-2 mini，但根據外媒實際測試，目前還只能看到「Grok-beta」的版本。價格方面，xAI 的定價略高於主流，每百萬輸入為 5 美元，輸出則是 15 美元，高於 OpenAI 的 GPT-4o（輸入 2.50 美元、輸出 10 美元）。
Microsoft宣布旗下的 Copilot 和 Dynamics 365 推出「代理功能」，強化 AI 工具的應用範圍。Dynamics 365 將新增 10 個預設的代理功能，這些 AI 能獨立操作銷售、服務、財務、供應鏈等領域的業務內容，不需要任何人工監督。Copilot Studio 則可以基於使用者需求，創造屬於自己的代理服務能力
新創公司 H2O AI，近期推出了小型 AI 模型 H2OVL Mississippi，設計有 2B 與 0.8B 兩種規格，官方公布 H2OVL 在 OCRBench 文字識別的測試結果！根據圖示， H2OVL 0.8B 在文字辨識的領域中，比其他同規模的前輩們還要優秀，以 274 分的成績順利奪得第一，與末位的 Phi-3-Vision 相差近 80 分。此外第二名的 Qwen2-VL 2B-Instruct 也非常亮眼，與前面的 H2OVL 0.8B 只差不到 10 分
Afforai 的共同創辦人 Alec Nguyen 接受訪談，分享了自己從大學以來的創業經歷，以及如何在三個月內讓 Afforai 的收入突破 70 萬美元！Afforai 主要透過了 AI 來優化學術引用，在過程中也經歷多次功能迭代，而 MVP 的設計能協助團隊快速掌握用戶回饋！近期推出了 Microsoft Word 的擴充程式，能讓使用者更方便地在 Word 裡管理引用，或是進行文獻標註
Meta 的基礎人工智慧研究(FAIR) 部門發布了一款名為「自學評估器」的人工智慧工具，可以評估和提高其他人工智慧模型的準確性，無需人為干預，從而在未來減少人類參與的需要在人工智慧的發展過程中。該論文描述了該模型如何遵循OpenAI 的 o1 模型使用的相同“思維鏈”方法，在做出回應之前進行“思考”。該模型會根據人工智慧模型自行產生不同的輸出，然後使用另一個人工智慧系統來評估準確性並改進輸出（尤其是在科學、編碼和數學方面）以解決不準確性問題。FAIR 研究人員僅使用人工智慧產生的資料來訓練評估器模型，因此無需人工輸入，據報導，性能比依賴人工標記資料的模型要好
廣告專家 Jessica Apotheker 探討了生成式人工智慧對廣告的影響，強調了行銷人員如何利用人工智慧，同時保持創意優勢

廣告傳奇人物 Seth Godin 討論了人工智慧在品牌和廣告中的本質整合，揭示了人工智慧如何改變產業以及品牌策略的未來。

Alejandro教授如何使用 CrewAI 透過 AI 代理自動執行廣告任務。

X（Twitter）更新了其隱私政策，表明它將允許第三方「合作者」使用 X 資料來訓練他們的人工智慧模型，除非用戶選擇退出
據報導，美國政府正在考慮限制向某些波斯灣國家（包括阿拉伯聯合大公國 (UAE) 和沙烏地阿拉伯）出售 NVIDIA 和 AMD AI 晶片，以解決國家安全問題。這些新的限制將類似於美國政府對向中國出口先進人工智慧晶片（來自 NVIDIA 和 AMD 等公司）和相關設備所施加的限制。美國及其盟國（荷蘭、德國、韓國和日本）一直在加強對中國人工智慧硬體的限制，因為美國的人工智慧晶片使它們在全球人工智慧舞台上獲得了關鍵優勢
Google Shopping 正在推出AI驅動的「for you」（在桌面和行動裝置上），該提要根據購物者的搜尋和 YouTube 歷史記錄向他們展示他們可能喜歡的個人化產品流。儘管Google將展示個性化產品和內嵌視頻，但如果購物者看到他們不喜歡的東西，他們可以“不喜歡”，從而阻止谷歌展示類似的東西。引入AI摘要功能，可以提供購物者關於要尋找什麼產品以及為什麼應該考慮所展示的商品的提示，而這些都是 Google 從網路評論中總結出來的
OpenAI 推出全新開源框架 Swarm，旨在協助開發者簡化多代理 AI 系統的創建與控制，該框架目前基於 OpenAI 的 ChatCompletions API 所構建。目前該框架已經在 Github ，也提供了數個應用案例，如天氣代理、航空公司客戶服務系統等等，以證明該框架有著無限的潛力。OpenAI 研究員 Shyamal Anadkat 也特別發文強調，Swarm 並非 OpenAI 的正式產品，並不適合投入實際的生產流程，也不會由 OpenAI 進行維護
AWS 宣布 Anthropic 的模型 Claude 3.5 系列上架 Amazon Bedrock！Claude 3.5 系列模型具備業界領先的準確性、效能、速度和成本優勢。AWS 快速上手系列線上Session 10/24 3pm報名連結

AI應用工具

Reword：提供 AI 重寫工具的平台，能幫助用戶快速地重新措辭和改寫句子或段落，適用於帖子、電子郵件或文章撰寫。此外，它還有一個協作寫作的功能，可以撰寫有幫助且優化搜尋結果的文章。能模仿你的寫作習慣、風格，有引文功能來確保內容真實性。
Trends Critical：幫助用戶快速了解最新趨勢的重要工具，它可以幫助用戶在趨勢達到主流之前，個性化地對其進行操作，從而節省大量的研究時間，利用人工智慧來發展您和您的業務。
Subatomic：一款AI SaaS工具，它可以幫助您在發表之前與您的受眾互動（Personas），並能夠更好地識別和連接您的受眾。這個平台建立在兩個強大的基礎上：角色（Personas）和品牌（Brand）。
Bookselects：一個提供書籍推薦的平台，幫助用戶根據他們的興趣獲得來自成功人士的書籍建議。這些建議包括頂尖小說家創作的小說以及來自商業領域的書籍。該網站還參與了亞馬遜聯盟計劃，以賺取廣告收入。
ChatNode：一個 AI 聊天機器人建構工具，它利用 ChatGPT 技術來根據用戶的數據（如文本、PDF 或網頁）訓練聊天機器人，並可以嵌入到網站中以改善用戶體驗。
ZenCall：一種管理未接來電的虛擬助手服務，能夠在您忙碌時保留您的身份。它還提供免費的專用電話號碼，使您能夠更有效地處理通話和預約。
Job Hunt Mode：一個由人工智慧驅動的職業服務平台，提供個性化的職業建議、量身定制的簡歷輔助和專家指導，幫助用戶在求職過程中取得成功。
Brilliant：一種學習平台，提供數學、科學和計算機科學的互動課程，採用互動式問題解決既有效又有趣，幫助用戶提升技能。

吉報

吉報 @ 10W3

20241024

AI行業動態

AI應用工具

Discussion about this post