長期以來,機器人視覺主要依賴單一攝像頭或簡單圖像識別算法,在光線變化劇烈、遮擋復雜、目標多樣的真實場景中,往往“力不從心”。面臨識別不穩定、誤報率高、難以理解語義意圖等問題。在機器人、智能制造和智慧城市加速發展的今天,視覺能力已經成為機器人“智慧程度”的關鍵衡量指標之一。
構建“感知+理解+決策”的綜合處理能力
數碼視訊(股票代碼:300079)依托多年視頻與AI技術沉淀,積極推進“AI感知多模態”機器人視覺解決方案,為各類機器人提供從“看得見”到“看得懂”的新一代感知底座。公司研發中的AI感知多模態方案,通過融合視覺、語音、深度信息以及各類環境傳感器數據,讓機器人不再只依賴“單一畫面”,而是擁有一套更接近人類的“感知+理解+決策”的綜合處理能力。
從感知層上,方案支持多類型攝像頭、相機、麥克風陣列、雷達等多種傳感器接入,實現圖像、語音、距離、運動狀態等多源數據采集;在理解層,基于多模態融合模型,將視覺、語音指令和場景語義進行統一特征對齊與融合,完成目標識別、場景解析、行為理解等任務,為上層業務提供結構化感知結果;在決策層,結合機器人運動控制與業務邏輯,對路徑規劃、抓取動作、人機交互策略進行智能決策,使機器人在復雜環境中保持穩定、可靠的執行能力。

(數碼視訊AI感知多模態應用解決方案)
推動多場景落地,助力機器人成為真正的“伙伴”
依托數碼視訊在邊緣計算和視頻AI算法上的深厚積累,該方案可靈活部署于多類型終端或平臺,在保障實時性的同時,兼顧功耗與成本,在眾多應用場景中都具備發展潛力。
服務與陪護機器人:融合視覺與語音識別,實現對用戶身份、表情和語言指令的綜合理解。機器人可以根據場景(如家庭、養老機構、商場)自動調整交互策略,提供更自然、更人性化的服務體驗。
安防與巡檢機器人:在弱光、雨霧、逆光等場景下,通過多模態融合進行目標識別與行為分析,并結合傳感器數據實現溫度異常檢測、設備狀態監測等,為園區、廠區、交通樞紐提供全天候智能巡檢能力。
工業與倉儲機器人:在復雜工位和混合貨物環境中,通過多模態感知實現精準定位、智能抓取與動態避障,顯著降低人工干預頻次,提升作業效率與安全性。
特種與戶外機器人:在戶外復雜地形、無GPS或弱信號環境中,利用視覺、深度和環境傳感數據的融合,提高對地形、障礙物的辨別能力,為應急救援、危險環境作業提供更高的安全保障。
此外,數碼視訊的AI感知多模態機器人視覺解決方案,可為機器人廠商、系統集成商等提供標準化接口與定制化算法服務,實現降低自研多模態算法與系統集成的門檻和成本、幫助合作伙伴快速構建差異化產品,縮短從方案設計到量產落地的周期等積極效果。未來,公司還將持續推進多模態感知與具身智能、端云協同大模型的深度結合,攜手生態伙伴共同打造新一代機器人智能感知平臺,讓機器人真正成為人類在生產生活中的“智慧伙伴”,為智能制造、智慧城市等行業注入新的發展動力。