speech-to-text

首页 > TAG信息列表 > speech-to-text

C#-语音评分(语音正确性)

是否有C#的算法或库可用于对用户发音进行评分？例如,诸如Levenshtein距离之类的用于文本但用于语音的类. 任何有关算法的相关链接或信息将很有用.我正在编写一个需要诸如语音识别之类的应用程序,因此,如果有相关的C#库,那就太好了. 当然,如果图书馆能够以文本(最好是多种语言)对文本

在Android 4.0中访问连续语音识别

我试图让连续的语音输入在我的Android应用程序中工作.我尝试使用内置的SpeechRecognizer Intent,但是它在处理单词之前会等待用户完成讲话.这对我来说还不够.我需要设备在用户仍在讲话时处理单词. 我读到冰淇淋三明治现在支持此功能.但是,我找不到任何允许我访问此功能的API.有人知

Python-OSX的语音识别库？

因此,我一直在网上寻找Python语音识别功能,然后发现pyspeech.但这仅适用于Windows.我想要一个与Mac aswel一起使用的语音识别库.谢谢！解决方法:http://andrewbrobinson.com/2012/02/29/speech-recognition-using-sphinx-dont-try-this-at-home/建议Pocket Sphinx包含Python绑定并且

Android应用程序中具有RecognizerIntent的数据安全

我正在使用RecognizerIntent开发一个Android语音识别应用程序.客户端担心设备与Google的语音识别服务器之间传输的数据以及该数据是否可以被截获. 我发现关于什么格式以及如何来回发送数据的文档很少. 有人知道我在哪里可以找到此信息吗？设备和Google语音识别之间的通信是否以任何方

Android语音转文本::实时更新文本

我想在我的应用程序中将语音转换为文本. 为此,我正在使用RecognitionListener接口一切正常,但是即使在说话时也如何更新和显示文本(例如在Google Now中进行语音搜索) 我已经将RecognizerIntent.EXTRA_PARTIAL_RESULTS设置为true并且还使用了RecognitionListener接口的onPartialResu

java-使用WebSockets的IBM Watson语音到文本

我正在尝试使用Watson Developer Cloud Java SDK转录大型音频文件.我尝试了Sessionless方法,并且效果很好,但是当我尝试WebSockets方法时,事情变得不可靠了. 在大多数情况下,该方法只会在没有将SpeechResult传递给委托人的情况下返回.它很少会起作用,但只会在最初的几秒钟内记录下

python-通过websockets流音频IBM无法正常工作

我正在尝试使用IBM Watson通过websockets通过麦克风流式传输音频.我收到以下错误： TypeError: The system cannot find the file specified 我认为子流程有问题,请帮助我纠正此问题/使其正常工作. from ws4py.client.threadedclient import WebSocketClient import base64, json

javascript – 跨浏览器语音识别

我目前正在ASP.NET中开展一个项目.我需要添加可在IE / Chrome / Firefox上运行的语音命令.我搜索了很多,但没有找到任何跨浏览器的解决方案. 有没有JavaScript框架可以做到这一点？我可以使用Google网络语音API作为服务吗？任何建议都会有所帮助.解决方法:您可以在Can I Use检查各种

如何隐藏Toast消息“你的音频将被发送到谷歌提供语音识别服务.”在Android？

我正在使用谷歌语音识别器在Android中集成语音服务,但在按下麦克风按钮时,这个恼人的吐司消息正在显示.请建议我隐藏此Toast消息的方法. 这是我的java代码 public class FormActivity extends AppCompatActivity { AppCompatEditText mFeedbackView; ImageView mFeedbac

java – SpeechRecognizer：没有选定的语音识别服务

这就是我启动我的RecogniseListener意图的方法： Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUAGE_MODEL_FREE_FORM); intent.putExtra("android.speech.extra.DICTA

如何在我的Nexus 5设备上使用其他语音识别服务？

这不是技术问题.我讨厌我的nexus 5(运行版本6.02)上的文本引擎发出某些单词的方式,我想改变它. 我试图从Settigs->语言和输入改变它,但是我无法找到它.我甚至不知道在哪里看.我甚至不知道这是否可能！如果是的话,我会感激一些指导:) 提前致谢！解决方法:Android v6中语音识别服务设置的

android的东西：使用语音在Raspberry Pi 3中使用android的东西

我使用下面的代码为Raspberry Pi3的语音到文本 Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);

android – 录制的声音文件(ala google now,google keep) – RecognizerIntent / Listener

我一直在开发一个使用recognizerIntent来获取语音输入的应用程序.但是,由于推出了果冻豆,我无法从语音输入中获取实际的声音文件. 在recognitionListener(http://developer.android.com/reference/android/speech/RecognitionListener.html)中有一个名为onBufferReceived的方法.但

谷歌语音API – PHP不返回任何内容

我的代码的灵感来自这个php版本的全双工谷歌语音API语音到文本：http://mikepultz.com/2013/07/google-speech-api-full-duplex-php-version/ 我有几个flac文件可以正常工作,并按照迈克的帖子解释给出数组输出.但对于少数flac文件,它只是不返回任何输出.例如：http://gavyadhar.com/vid

Android中的语音识别服务

我有一个在Activity中使用语音识别的Android应用程序.除了包含语音识别对象之外,GUI不做任何事情.我想把它移植到一个服务,所以我可以在后台运行时与应用程序通信. 但是,据我所知,语音识别服务必须使用onActivityResult,它不适用于服务.有没有办法在服务中包含一个活动,以便不显示

Android：语音识别方法

所以我正在写一个新的应用程序,我需要识别几个单词.我想知道你建议我用什么方法来满足这两个要求： >我需要应用程序识别大约50个单词.简单的单词,如“蓝色”,“红色”,“保存”等. >必须在不使用Internet访问某种服务器的情况下完成从我目前的研究来看,似乎CMUSphinx是最好的选择.

c# – Google Cloud API语法

使用此代码我在youtube视频上找到了(不知道我是否能够发布)： if (File.Exists("audio.raw")) { var speech = SpeechClient.Create(); var response = speech.Recognize(new RecognitionConfig() { Encoding = RecognitionConfig.Types.AudioEncoding.Linear16

android – 语音到文本API或SDK for Mobile(跨平台)

什么是当前支持的最佳语音或文本API或移动SDK(多个平台：Android,iOS等) 有一些特别针对iPhone的帖子,但我正在寻找一种理想的跨平台解决方案. 注：似乎所有解决方案最终都发布到远程服务器上的REST-ful API,而不是在本地进行语音处理. (这是真的？)解决方法:我可以想到一些Android和iOS

javascript – 检测x-webkit-speech？

我想检测浏览器是否支持使用JavaScript的x-webkit-speech(语音到< input>中的文本),但似乎不可能.我怎样才能做到这一点？ (如果浏览器或其版本不支持,我想显示一条消息.)解决方法:您可以检查浏览器是否支持这样的语音： if( document.createElement('input').webkitSpeech==undefined

Android上的实时呼叫转录

我是一名患有听力障碍的Android开发人员,我目前正在探索使用Android中的Speech Recognizer API为文本应用程序发表演讲的选项.隐藏式字幕电话和Innocaption在我的国家/地区不可用.潜在的应用可能就像电话中的字幕. https://developer.android.com/reference/android/speech/SpeechR

使用C#语音文本

我正在尝试使用C#语言设计文本编辑器并为正常文件功能实现语音识别,这是否可以实现.如果我重复之前提出的问题,我感到非常抱歉.我只是想知道是否有方法使用C#将语音转换为文本.你的帮助非常宝贵.等待回复.提前致谢.解决方法:以下是使用C#和System.Speech从语音转换为文本的完整示例

java – 语音到文本识别

我是Android开发的初学者.是否有可能将语音写入可以访问基于Googles网络的后端语音到文本系统的文本软件？解决方法:您可以尝试识别器意图…查看下面的链接,看看它是否回答您的查询： sample code for voice recognition voice recognizer documentation

如何在android语音识别中同时使用多种语言

我们都知道,许多语言包括其他语言的几个单词.在使用Android语音识别(Androdi4.1)开发Android应用程序时,我们需要该应用程序同时处理两种语言(EN和TR)的语音输入(或asynch),并为我们带来两个结果. “Turkish”的发音“土耳其语”是英语中的“Börgır”. 如果我们在英语中使用andro

javascript – Annyang将语音转换为文本

我正在尝试使用annyang将语音转换为文本,但我遇到了一些问题.它有效,但还有一些东西还没有.首先,我想知道如何将用户说出的任何内容传递到警报功能中.接下来,我想知道当用户说完后如何结束annyang功能.最后,我想知道如何让允许和禁止麦克风提示一旦出现一次又一次出现. <script> i