编程语言
首页 > 编程语言> > java-使用WebSockets的IBM Watson语音到文本

java-使用WebSockets的IBM Watson语音到文本

作者:互联网

我正在尝试使用Watson Developer Cloud Java SDK转录大型音频文件.我尝试了Sessionless方法,并且效果很好,但是当我尝试WebSockets方法时,事情变得不可靠了.

在大多数情况下,该方法只会在没有将SpeechResult传递给委托人的情况下返回.它很少会起作用,但只会在最初的几秒钟内记录下来.

这是我的代码如下所示:

static SpeechResults transcript = null;
private static String SpeechToText(String audioFile) throws FileNotFoundException {
        SpeechToText service = new SpeechToText();
        service.setUsernameAndPassword("<!!USERNAME!!>", "<!!PASSWORD!!>");
        service.setEndPoint("https://stream.watsonplatform.net/speech-to-text/api");

        RecognizeOptions options = new RecognizeOptions();
        options.contentType("audio/ogg;codecs=opus");
        options.continuous(Boolean.TRUE);
        options.inactivityTimeout(-1);
        options.model(Models.GetModelName(Models.SpeechModelEnums.ArabicBroadband));
        options.timestamps(Boolean.TRUE);
        options.wordAlternativesThreshold(0.5);
        options.wordConfidence(Boolean.TRUE);

        options.interimResults(Boolean.FALSE);

        File audio = new File(audioFile);

        //This is my sessionless call
        //SpeechResults transcript = service.recognize(audio, options);


        service.recognizeUsingWebSockets(new FileInputStream(audio),  options, new BaseRecognizeDelegate()
        {
                @Override
                public void onMessage(SpeechResults speechResults){
                System.out.println(speechResults);                
                }
            }
        );

        return "";//transcript.toString();
    } 

我已连续启用.我尝试摆弄interimResults,但没有用.

我究竟做错了什么?

解决方法:

您提到的问题已在3.0.0-RC1版本中修复.
我有answered个类似的问题,并添加了一个代码片段,可使用WebSockets识别音频文件.

从3.0.0-RC1开始,在README中有一个WebSocket示例.

标签:speech-to-text,ibm-cloud,ibm-watson,java
来源: https://codeday.me/bug/20191027/1941801.html