Google DeepMind 正在研發一款結合人工智慧的滑鼠指標,這項技術能理解使用者在螢幕上點擊的上下文,是逾半世紀以來滑鼠指標設計的重大突破。這項創新整合了 Google 的 Gemini AI 模型與實驗性的情境感知滑鼠指標,旨在讓 AI 助手能更直覺地融入數位互動,免去使用者在不同應用程式間複製、貼上或拖曳內容的繁瑣操作,提升使用流暢度。
根據《The Register》報導,現行的 AI 助手往往需要使用者手動將內容複製到獨立的聊天介面,造成使用上的阻礙。Google DeepMind 的研究團隊則希望實現「直覺式 AI」,讓 AI 能在使用者使用的所有工具中提供協助,而不會中斷其操作流程。這個 AI 滑鼠指標將與電腦麥克風協同運作,讓 Gemini 能在使用者點擊螢幕的同時接收語音指令,進而理解「這個」、「那個」等自然語言指示。
這項名為「Magic Pointer」的功能預計將在即將推出的 Googlebook 筆記型電腦平台上亮相。此外,Gemini in Chrome 的使用者未來也能夠指向網頁特定區域並提出問題。目前,這款 AI 強化指標的實驗性演示已透過 Google AI Studio 提供,而 Google 也計劃在包括 Google實驗室(Google Labs)旗下的 Disco 在內的其他平台繼續測試這項概念。