Googles Spracherkennung in eigenen Anwendungen nutzen?

  • Hab jetzt mal eine ganze Weile gesucht, aber lediglich festgestellt das es "irgendwie" möglich sein muss.
    Diese App hier z.B. nutzt es - funktioniert auch ganz gut: http://www.vdi-nachrichten.com…r-ein-offenes-Ohr/60840/3
    Würde gern ein Java oder C++ ein wenig damit herumspielen und stelle mir das prinzipiell recht einfach vor: Aufnahme --> File an Google Server ---> Text zurückbekommen ---> auswerten.
    Denke mal genau so funktionieren auch die Apps die das nutzen, ist ja kein Hexenwerk.
    Jedoch finde ich keine entsprechende API, nur die Möglichkeit von Sprachsuche mittels Chrome und die kann wohl nur Englisch.
    Weiss da wer weiter?

  • Es gibt da was in Ruby: https://github.com/taf2/speech2text

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • Mir Ruby kann ich leider nicht viel anfangen, aber die Sourcen enthielten die URL an die geschickt wird.
    Scheinbar führt der Weg darüber.
    Ein wenig Googeln führte mich dann zu dieser Seite:
    http://sebastian.germes.in/blog/2011/09/googles-speech-api/
    Werd mal sehen was man damit basteln kann, mir schwebt da was vor was z.B. meine Lichtschalter und Funksteckdosen bedient
    und mir früh im Bad was über den kommenden Tag erzählt.


    Dank Raspberry PI kann man ja einen Computer nun ununterbrochen laufen lassen ohne an der Stromrechnung zu verarmen... ;)

  • Hmm - funktioniert zwar, aber so richtig gut auch nicht. :

    Code
    C:\curl2>curl -i -X POST -H "Content-Type:audio/x-flac; rate=16000" -T test.flac  "https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=de-DE&maxresults=10&pfilter=0" --insecure


    Ergebnis:


    Obwohl de-DE als Sprache angegeben ist bringt er englischen Text.
    Im gesendeten File fragte ich: "Wozu gibt es diese Funktion?" :D
    Na mal sehen, aber irgendwie kann man das benutzen denke ich.
    Zur Not spricht meine Wohnung halt englisch.

  • Ich nehme alles zurück - das ganze funktioniert fantastisch!
    Die Aufnahme war einfach nur zu leise.
    Hab jetzt weitergetestet, sogar mit Straßenlärm im Hintergrund ist meist ein genauer Treffer dabei. :)
    Ich glaub ich hab was vor am Wochenende... :]


    {"status":0,"id":"54b428f7496c14961dcaa1093ecb649b-1","hypotheses":[{"utterance"
    :"dies ist ein test","confidence":0.7903987},{"utterance":"ziel"},{"utterance":"
    fanta"},{"utterance":"├╝bersetzer"},{"utterance":"hier ist ein test"},{"utteranc
    e":"web dies ist ein test"},{"utterance":"ziel fanta"},{"utterance":"ziel dies i
    st ein test"},{"utterance":"ente"}]}


    {"status":0,"id":"799e6ef01f8756ac6b5c0f9b7d523514-1","hypotheses":[{"utterance"
    :"wann hast du zeit","confidence":0.84817886},{"utterance":"wann haste zeit"},{"
    utterance":"wann hast du zuletzt"}]}


    {"status":0,"id":"64fed0f51443d4b90a31f94ee284e697-1","hypotheses":[{"utterance"
    :"auf deutsch bitte","confidence":0.70963067},{"utterance":"auf deutsch"},{"utte
    rance":"auf deutsch ├╝bersetzen"},{"utterance":"auf sylt"},{"utterance":"deutsch
    "},{"utterance":"bitte"},{"utterance":"ruf deutsch"},{"utterance":"orf deutsch"}
    ,{"utterance":"deutsch bitte"},{"utterance":"auf sylt bitte"}]}

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!