1. 如何調出Excel菜單欄里工具箱下拉列表的語音選項
工具-自定義-命令-工具-語音識別
把語音識別拖動到任一個工具欄內就行了
2. 深度識別的工具箱可以運行語音識別程序嗎
使用YQ5969,這個語音識來別技術可以支持源本地和雲端識別不同需求。5米內本地識別率93%以上,雲端識別率97%。這個語音識別技術特徵在安靜環境下的語音識別系統已經接近了人類的水平,目前也有很多實際的應用,但目前的語音識別系統在強雜訊干擾情況下還很難達到實用化要求。
3. 現有主要的語音/聲音處理編程工具箱,SDK等主要有哪些
成兒姐,猜猜我是誰~~
4. 工具箱語音王下載
這是做的一個軟體實現的YY字幕工具去這里下載 有教程 多給點分
5. 研一剛接觸語音識別,怎麼運用kaldi工具箱做一個baseline
語音識別開發平台有很多,具體總結如下:(更詳細的介紹參見本人的博文:幾個常見的語音交互平台的簡介和比較)
1.商業化的語音交互平台
1)微軟Speech API
微軟的Speech API(簡稱為SAPI)是微軟推出的包含語音識別(SR)和語音合成(SS)引擎的應用編程介面(API),在Windows下應用 廣泛。目前,微軟已發布了多個SAPI版本(最新的是SAPI 5.4版),這些版本要麼作為於Speech SDK開發包發布,要麼直接被包含在windows 操作系統中發布。SAPI支持多種語言的識別和朗讀,包括英文、中文、日文等。
2).IBM viaVoice
IBM是較早開始語音識別方面的研究的機構之一,早在20世紀50年代末期,IBM就開始了語音識別的研究,計算機被設計用來檢測特定的語言 模式並得出聲音和它對應的文字之間的統計相關性。1999年,IBM發布了VoiceType的一個版。2003年,IBM授權ScanSoft公司擁有基於ViaVoice的桌面產品的全球獨家經銷權,隨後ScanSoft與Nuance合並,如今viaVoice早已淡出人們的視線,取而代之的是Nuance。
3)Nuance
Nuance通訊是一家跨國計算機軟體技術公司,總部設在美國馬薩諸塞州伯靈頓,主要提供語音和圖像方面的解決方案和應用。目前的業務集中 在伺服器和嵌入式語音識別,電話轉向系統,自動電話目錄服務等。Nuance語音技術除了語音識別技術外,還包擴語音合成、聲紋識別等技術。世界語音技術市場,有超過80%的語音識別是採用Nuance識別引擎技術, 其名下有超過1000個專利技術,公司研發的語音產品可以支持超過50種語言,在全球擁有超過20億用戶。蘋果的iPhone 4S的Siri語音識別中就應用了Nuance的語音識別服務。
4)科大訊飛
科大訊飛作為中國最大的智能語音技術提供商,在智能語音技術領域有著長期的研究積累,並在中文語音合成、語音識別、口語評測等多項 技術上擁有國際領先的成果。佔有中文語音技術市場60%以上市場份額,語音合成產品市場份額達到70%以上。
5)其他
其他的影響力較大商用語音交互平台有谷歌的語音搜索(Google Voice Search),網路和搜狗的語音輸入法等等。
2.開源的語音交互平台
1)CMU-Sphinx
CMU-Sphinx也簡稱為Sphinx(獅身人面像),是卡內基 - 梅隆大學( Carnegie Mellon University,CMU)開發的一款開源的語音識別系統, 它包括一系列的語音識別器和聲學模型訓練工具。最早的Sphinx-I 由@李開復 (Kai-Fu Lee)於1987年左右開發,使用了固定的HMM模型(含3個大小為256的codebook),它被號稱為第一個高性能的連續語音識別 系統(在Resource Management資料庫上准確率達到了90%+)。 最新的Sphinx語音識別系統包含如下軟體包:
Pocketsphinx — recognizer library written in C.
Sphinxbase — support library required by Pocketsphinx
Sphinx4 — adjustable, modifiable recognizer written in Java
CMUclmtk — language model tools
Sphinxtrain — acoustic model training tools
這些軟體包的可執行文件和源代碼在sourceforge上都可以下載得到。
2)HTK
HTK是Hidden Markov Model Toolkit(隱馬爾科夫模型工具包)的簡稱,HTK主要用於語音識別研究,最初是由劍橋大學工程學院(Cambridge University Engineering Department ,CUED)的機器智能實驗室(前語音視覺及機器人組) 於1989年開發的,它被用來構建CUED的大詞彙量的語音識別系統。HTK的最新版本是09年發布的3.4.1版,關於HTK的實現原理和各個工具的使用方法可以參看HTK的文檔HTKBook。
3)Julius
Julius是一個高性能、雙通道的大詞彙量連續語音識別(large vocabulary continues speech recognition,LVCSR)的開源項目, 適合於廣大的研究人員和開發人員。它使用3-gram及上下文相關的HMM,在當前的PC機上能夠實現實時的語音識別,單詞量達到60k個。
4)RWTH ASR
該工具箱包含最新的自動語音識別技術的演算法實現,它由 RWTH Aachen 大學的Human Language Technology and Pattern Recognition Group 開發。RWTH ASR工具箱包括聲學模型的構建、解析器等重要部分,還包括說話人自適應組件、說話人自適應訓練組件、非監督訓練組件、個性化 訓練和單詞詞根處理組件等。
5)其他
上面提到的開源工具箱主要都是用於語音識別的,其他的開源語音識別項目還有Kaldi 、simon 、iATROS-speech 、SHoUT 、 Zanzibar OpenIVR 等。
6. 語音處理工具箱怎麼用
解壓至某個目錄下(如果該工具箱是壓縮的話),比如 D:\voicebox
然後在matlab中把D:\voicebox 添加到搜索路徑里就行了。
7. matlab之語音處理與合成工具箱有沒有中文版本
你可以試試這個語音合成助手,不懂版可以看權這個http://jingyan..com/article/e9fb46e1606b6a7521f76699.html
8. 下載一個工具箱裡面的語音助手
X
9. Python中有沒有類似Matlab中VoiceBox的語音處理工具箱
有的,如下:
1. 解壓voicebox.zip,將整個目錄voicebox復制到MATLAB的安裝目錄下:
D:\MATLAB\R2012b\toolbox
2. 打開MATLAB,在版MATLAB命令窗口中輸入權命令:
>>cd D:\MATLAB\R2012b\toolbox
3. 將TOOLBOX下新加的voicebox工具箱加到MATLAB的搜索路徑中去。
添加voicebox工具箱的MATLAB的搜索路徑也可採用如下指令
>> addpath(genpath(' D:\MATLAB\R2012b\toolbox\voicebox'))
或者
>>path(' D:\MATLAB\R2012b\toolbox\voicebox',path)
4. 檢驗是否成功設置的方法:
在命令窗口中輸入以下命令:
which activlev.m(可以為所加工具箱的任一個M文件名稱),如果顯示正確,就說明上面的設置成功。
>> which activlev.m
D:\MATLAB\R2012b\toolbox\voicebox\activlev.m
註:這種方法貌似每次重啟MATLAB之後都要添加路徑,否則會找不到