還記得第一次和智慧音箱對話時的驚喜嗎?現如今,語音互動早已走出「新奇」階段,成為各行各業日常生活與工作的重要工具。在數位化轉型與智慧化設備快速推進的時代,語音互動已經成為人機介面的新標準。終端客戶期待的是自然、即時且隱私安全的體驗,而不再滿足於需要網路、延遲明顯的雲端方案。
傳統雲端語音方案一直面臨的主要挑戰分別為:
1. 過度延遲下達指令之後,還需要等待雲端的回應。
2. 網路依賴無法在飛航模式或訊號不佳的環境中運作。
3. 隱私疑慮語音的資料必須上傳,因此存在安全風險。
而現在,我們結合聯發科 Genio 平台的高性能與Cyberon 語音轉文字 (Speech-to-Text)的本地端能力,正式帶來一個能落地應用的智慧語音解決方案,在設備上即時將語音轉換成文字,無需依賴雲端,這意味著我們已經不僅停留在概念,而是真正能負擔得起、用得穩的成熟方案。這正是聯發科 Genio × Cyberon 語音轉文字帶來的改變,我們已將Cyberon STT APK成功安裝並運行於 Genio 平台,實現純本地端的語音轉文字每一句話都能在設備上立即被理解並執行,無需上傳至雲端。
可以想像一下,在車上,你只要說「導航回公司」,系統立即執行,不必低頭操作螢幕。在會議中,你專心討論,不必做筆記,因為逐字稿已經自動生成。在校園學習時,字幕幫助你跨越語言障礙,讓知識不再設限。在家裡,只需一聲令下,燈光、空調、音樂隨你掌控。對於聽障人士,對話瞬間化為文字,溝通不再有阻礙。
這不僅是便利,而是讓科技適應人類,而不是人去學習機器,讓品牌不僅是一個產品,而是一個更智能、更貼近使用者的夥伴。
MediaTek Genio × Cyberon STT 本地端解決方案已準備好為新一代智慧設備 Genio 720 注入語音靈魂。在這個「說出來就能做到」的時代,我們將協助您打造真正聽得懂使用者的產品。
主要的核心技術:
1. Cyberon STT 引擎優勢
離線運行 (Offline)無需網路即可辨識語音。
即時反應(低延遲)指令執行幾乎零延遲。
隱私保護 (Privacy)語音資料完全保留在本地,不上傳雲端。
多語言支援 (Multi Language)適合全球市場。
2. MediaTek Genio 平台優勢
強大的運算性能支援 AI 推理與多媒體處理。
Android 生態整合可快速開發應用並整合現有系統。
接下來介紹幾項潛在的應用場景:
1. 從記錄者變成思考者,在忙碌的職場與校園,它是你的效率神器
想像一場腦力激盪會議,在過去,可能需要一邊聆聽,一邊快速地敲打鍵盤或寫筆記,生怕錯過任何一個重點,大腦在「聽」與「寫」之間疲於奔命,真正用於「思考」的精力所剩無幾。現在聯發科 Genio × Cyberon 語音轉文字整合了即時字幕與逐字稿功能,就像一位永不疲倦的記錄者,精準捕捉每一句發言,可以放下鍵盤,百分之百地投入討論,讓你專注於討論議題本身,會後還能快速搜尋關鍵內容,大幅提升了工作效率。


在線上學習成為主流的今天,觀看國外大學的線上課程或知識型 YouTube 影片時,即時生成的字幕,幫助我們跨越語言和口音的障礙,不再因口音或語速而困擾。聯發科 Genio × Cyberon 語音辨識在此扮演了知識傳播的加速器,打破了語言和聽力的隔閡,跨越語言障礙,讓知識不再設限。

2. 聽見世界的聲音,在需要幫助的特殊時刻,它是溫暖的援手
當你身處異國他鄉,比如在機場甚至在沒有中文或英文環境的餐廳中,面對完全陌生的語言,正需要幫助時,MediaTek Genio × Cyberon STT就是你的救星,這個小小的科技奇蹟,正在拉近世界不同文化之間的距離。
對於聽障族群而言,世界有時是無聲的。一場家庭聚會的歡聲笑語、一堂課堂上的師生問答、一場重要的醫生問診,都可能因為聽不見而產生隔閡。聯發科 Genio × Cyberon 語音辨識就能將周圍的聲音即時轉化為眼前的文字。這不僅僅是資訊的傳遞,更是情感的連結與社會的參與。它讓一位聽障學生能「看見」教授的講課,讓一位聽障父親能「讀懂」孩子的童言童語,讓溝通的權利真正回到每個人手中。
接著介紹聯發科 Genio × Cyberon 語音轉文字的使用介面,可以進行多國語言之間的翻譯,比如使用世界常用的問候語「你好」,可以得到翻譯後的結果為 Hello、你好。



至此,你會發現聯發科 Genio × Cyberon 語音轉文字早已不再是一個「功能」,而是一種「能力」,一種讓科技適應人類本能,而非強迫人類學習機器的能力。它隱藏在我們熟悉的介面背後,默默地聆聽、翻譯、執行,所以下次當你開口下達指令時,不妨感受一下,那位在背後為你服務的強大 AI,是如何用最自然的方式,讓你的生活變得更簡單了一些。
►場景應用圖

►展示板照片

►方案方塊圖

►核心技術優勢
1. 離線運行:無需網路即可辨識語音。 2. 即時反應:指令執行幾乎零延遲。 3. 隱私保障:語音資料完全留在本地,不上傳雲端。 4. 多語言支援:適合全球市場。 5. 強大運算性能:支援 AI 推理與多媒體處理。 6. Android 生態整合:可快速開發應用與整合現有系統。
►方案規格
• MIPI-DSI • DisplayPort • 數位麥克風