重點新聞(1024~1030)
Google 量子運算 量子迴聲
比超級電腦快上13,000倍!Google成功執行量子迴聲演算法還可驗證
Google日前以自家Willow量子晶片,成功執行量子迴聲(Quantum Echoes)演算法,運算速度比全球最快超級電腦快上13,000倍,還在實驗中展示可驗證量子優勢,也就是能被不同量子電腦重現與驗證。這項研究已刊登於《自然》期刊,是量子運算邁向實際應用的重要里程碑。
量子迴聲演算法有助於學習自然界中各種系統的結構。Google與加州大學柏克萊分校進行專案,以兩種分子作為概念驗證對象,結果與核磁共振(NMR)實驗一致,甚至能解析傳統NMR無法觀測的化學結構資訊。
Google指出,這項突破建立在6年研發與錯誤抑制技術突破之上,讓量子電腦首次具備精確度與複雜度兼具的可重現運算能力。團隊形容,這是邁向「量子顯微鏡」(Quantum-scope)的一步,未來它將有能力測量以前無法觀測到的自然現象,比如由量子運算強化的NMR,可成為藥物開發的強大工具;或在材料科學中,用於鑑定新材料的分子結構。(詳全文)
論文 史丹佛大學 AI代理
史丹佛大學打造Paper2Agent,直接把論文變成能自動執行任務的AI代理
傳統研究要重現結果,通常得翻論文、讀原始碼、改環境,光是執行就得花上幾天。不過,美國史丹佛大學團隊日前推出一項開源專案Paper2Agent,要讓論文結果重現更簡單,不再需要手動抓程式碼、裝套件、對資料夾。
進一步來說,Paper2Agent會用多個AI代理去讀論文內容、分析對應的GitHub程式與資料,接著把這些步驟包成一個MCP工具伺服器,再不斷自動生成測試、除錯到能穩定執行。最後,研究者只要把這個MCP接進如Claude Code的聊天介面,就能用自然語言對論文AI代理下指令,像是「幫我重現Figure 2的分析」、「換另一組參數再跑一次」,都能直接完成。
研究團隊已經用它重現多篇生物資訊論文,包括AlphaGenome的基因變異解析,以及Scanpy、TISSUE的單細胞與空間轉錄體分析,甚至讓系統自動找出與ADHD相關的新基因變異。但研究團隊也坦言,Paper2Agent並非十全十美,比如它自動分析論文時,可能誤解作者意圖、抽錯步驟,或遇到過期的環境設定與權限問題而無法執行。有些實驗需要高階GPU或特殊資料集時,仍得靠人工介入。(詳全文)

OpenAI AI代理 資安
能找漏洞還能自動提修補,OpenAI推出資安研究AI代理
OpenAI近日發表一款AI資安工具Aardvark,它以GPT-5為基礎,能像人類資安專家一樣分析程式碼、找出漏洞並自動提出修補方案。Aardvark以LLM推理為基礎,不像是傳統fuzzing或軟體組件分析等工具。它能讀懂整個程式庫的架構、建立威脅模型,也能逐行找出邏輯錯誤、未完整修補的舊問題和隱私相關漏洞。當儲存庫被連結後,Aardvark會先完整掃描歷史,之後持續監控每次提交,並在程式碼變動時即時偵測新漏洞。
整個漏洞處理流程有4大階段:首先是分析程式碼庫、建立威脅模型,再來是對每次提交進行比對與掃描;第三步在沙盒(Sandbox)環境中嘗試實際觸發漏洞,確認可利用性並降低誤報。最後,Aardvark會透過Codex生成修補程式碼,並附上一鍵提交Pull Request的選項。OpenAI表示,這能讓工程團隊在不打斷開發速度的情況下,快速採用高品質修補。(詳全文)
超級電腦 Nvidia Blackwell GPU
Nvidia要打造美國能源部最強AI超級電腦
Nvidia聯手美國能源部(DOE)旗下阿貢與洛斯阿拉莫斯國家實驗室,打造新一代AI超級基礎設施,推動美國在能源、安全與科學領域的技術研究。阿貢實驗室將部署超強算力的AI超級電腦Solstice,搭載10萬顆Nvidia Blackwell GPU,同時還有一套名為Equinox的AI超級電腦,搭載1萬顆Nvidia Blackwell GPU,總AI效能將達2,200 exaflops。此外,阿貢實驗室還要推出Tara、Minerva、Janus等3款系統,來讓全美研究人員更容易取得AI運算資源。
洛斯阿拉莫斯實驗室則會採用Nvidia旗下Vera Rubin平臺和Quantum-X800 InfiniBand架構,來建置Mission與Vision系統,預計2027年上線,用於國安與高機密模擬。Nvidia同時也在維吉尼亞州成立AI工廠研究中心,發表Omniverse DSX數位孿生藍圖,為未來「百萬瓩級AI工廠」奠基。
此外,思科、Dell、HPE、Oracle、微軟與CoreWeave等業者也投入建構AI雲端與伺服基礎,黃仁勳形容這場AI基礎建設布局是「屬於這個世代的登月計畫」,將為美國AI創新與產業革命奠定根基。(詳全文)
思科 AI 基礎架構
思科AI調查:僅8%臺灣企業準備好迎接AI浪潮
思科日前發布2025年度《人工智慧準備度指數》(AI Readiness Index)調查,訪問全球30個市場、26個行業、逾8,000位AI決策者,為全球企業AI布局提供第三年觀察。結果顯示,臺灣僅有8%企業達到「領導者」水準,遠低於全球平均的13%。這些臺灣企業在AI策略、架構和安全等層面領先,將AI試點專案轉為實際應用的機率是其他企業的5倍,也高出四成機率創造實際價值。
調查指出,全球的AI領導者普遍擁有明確AI藍圖(99%)、可擴展的基礎架構(71%),並將AI列為首要投資(79%);相較之下,臺灣整體企業在這些面向的比例分別只有53%、11%與18%,落後國際AI領導者許多。此外,82%臺灣企業計畫部署AI代理(AI Agents),其中3成預期一年內與員工協作,但多數仍面臨GPU不足、資料孤島與安全架構不全等挑戰,也就是所謂的「AI架構債務」問題。思科提醒,若不解決該問題,將會影響企業未來發展AI的瓶頸。(詳全文)
Cognition SWE-1.5 Windsurf
寫程式AI助手SWE‑1.5問世,號稱比Claude Haiku 4.5快6倍
曾打造程式開發AI助手Devin的Cognition團隊,最近又發表最新模型SWE-1.5,是一款專為軟體工程任務打造的代理模型,不只寫程式更快,使用者用也能靠對話和指令來驅動程式任務,目前已在Windsurf上線。
Cognition點出,SWE-1.5最大優勢是快速和高效。雖然模型有千億參數,但動作非常快,號稱推理速度最高可達每秒950個Token,是Claude Haiku 4.5的6倍快、Sonnet 4.5的13倍快。官方也指出,「編輯一段Kubernetes設定」這類常見任務,SWE-1.5可以把執行時間從原本的20秒縮短為約5秒完成,保持工作流程不中斷。
為了讓模型在實務中表現更好,團隊還手動建立了高擬真的程式開發環境,並利用3種評分機制,來降低模型為了通過測試而產出無意義程式碼的問題。團隊表示,經測試,模型不只能通過大部分測試,還能寫出更乾淨、可維護的程式碼。但他們也坦言,模型在程式碼可讀性、程式設計等指標還未達最優表現。(詳全文)
MiniMax M2 程式開發
MiniMax-M2:為開發者量身打造的「程式碼+代理」型語言模型
中國AI新創MiniMax-AI最近開源了MiniMax-M2模型,專為程式開發流程和代理工作打造。該模型共有230億參數,但執行時大約只用100億參數,來在成本、延遲和效能等方面取得平衡。
團隊指出,該模型適合開發團隊工作,可執行多檔案編輯、寫程式→執行→修復循環,再到瀏覽器+Shell+檢索工具的複雜流程。官方聲稱,該模型在多項程式碼撰寫和代理基準上,都名列開源模型前茅。不過該模型也並非萬能,目前社群反應指出,針對UI複雜、前端互動等非典型程式任務時,仍需人工介入。對於極端規模的上下文或非常規語境,模型表現也可能不及高階的閉源模型。(詳全文)

GitHub AI代理 管理
整合多代理協作和管理功能,GitHub釋出Agent HQ平臺
GitHub最近在Universe 2025大會中,揭露一款Agent HQ平臺,讓AI程式開發代理(AI Agents)走進日常開發流程,還整合到GitHub和VS Code。未來幾個月內,使用者將可透過付費版GitHub Copilot,訂閱使用來自OpenAI、Anthropic、Google、Cognition與xAI等業者的AI代理。目前,Copilot Pro+用戶可先在VS Code Insiders試用OpenAI Codex代理。
gent HQ將代理視為開發流程的原生參與者,支援Git、Pull Request和Issue等既有工作方式,也能在GitHub Actions或自架Runner上執行任務。開發者可在統一介面中指派工作、追蹤進度、管控代理權限,也能以分支控制和身分管理,來確保安全和審查流程。
GitHub還另外推出MCP Registry,方便啟用Stripe、Figma、Sentry等專業代理。企業用戶則可透過Code Quality量測、AI控制平面和Copilot儀表板,來監控代理品質、使用政策和採用成效,讓AI協作更透明可管。(詳全文)
圖片來源/Google、史丹佛大學、Cognition、MiniMax
AI近期新聞
1. OpenAI發布Company Knowledge工具,可彙整企業所有資料來源、生成專用答案
2. 迭代3年和徹底重寫,LLM框架LangChain v1.0 Alpha版正式發布
3. Nvidia以10億美元入股Nokia,共同發展AI原生行動網路
資料來源:iThome整理,2025年10月
