- vừa được xem lúc

Hướng dẫn build ứng dụng sử dụng dịch vụ Speech To Text của Google Cloud trên NodeJS

0 0 42

Người đăng: Kha Leo

Theo Viblo Asia

Hiện tại có rất nhiều nhà cung cấp hỗ trợ service nhận diện giọng nói từ file sang văn bản, nổi bật nhất trong đó có lẽ là service từ Google Cloud. Hôm nay mình sẽ hướng dẫn các bạn cách setup và sử dụng service này trên nền tảng NodeJS.

image.png

I. Đăng kí tài khoản Google Cloud

Để sử dụng service của Google Cloud, trước tiên chúng ta cần đăng kí tài khoản: https://console.cloud.google.com/freetrial/signup/

image.png

Điền đầy đủ thông tin yêu cầu ở bước 2, lưu ý Google Cloud yêu cầu người dùng cung cấp thông tin thẻ Visa, Master Card mới có thể đăng kí tài khoản (hiện tại Google không chấp nhận thẻ Master Card ảo, nên không thể dùng thẻ Master Card ảo đăng kí bằng Viettel Pay hay bên bất kì nào nhé). image.png

Sau khi tạo thành công tài khoản, ta vào Dashboard của Google Cloud và tạo một chứng thực (credential) và lưu về máy. image.png

Set biến môi trường ở máy của bạn, cho phép gọi APIs mà Google cung cấp với credential đã tải về

  • Với Linux/MacOS image.png

  • Với Window image.png

II. Tạo Project NodeJS

  1. Tạo thư mục chứa project, đặt tên CloudSpeech

  2. Mở terminal, đi đến thư mục đã tạo, chạy câu lệnh “npm init” (Yêu cầu máy của bạn phải cài NodeJs rồi nhé)

  3. Điền các thông tin cần thiết (nếu có), và nhấn enter để tiếp tục image.png

  4. Tạo file index.js bằng câu lệnh “echo > index.js” hoặc tự tạo bằng tay nhé

  5. Install package: npm install @google-cloud/speech

  6. Google Cloud có rất nhiều project sample như convert file voice to text, nhận diện giọng nói từ microphone, ở đây mình sẽ demo với project infinite streaming: https://github.com/googleapis/nodejs-speech/blob/master/samples/infiniteStreaming.js

  7. Các bạn copy hết source ở trên và bỏ vào file index.js đã tạo ở trên nhé.

  8. Install các package cần thiết:

  • npm i chalk
  • npm i node-record-lpcm16
  1. Để project nhận diện được voice từ micro và convert sang đúng định dạng mà Google Cloud Speech yêu cầu ta cần dùng SoX, install Sox tại: http://sox.sourceforge.net/ image.png

Hiện tại version 14.4.2 đang gặp một số lỗi nên chúng ta sẽ install version 14.4.1 Với MacOS thì đơn giản hơn, chúng ta chỉ cần chạy câu lệnh “brew install sox” với terminal, không cần tự tải

III. Config

Các bạn mở file index.js lên, trong function main, chúng ta có thể điều chỉnh languageCode về ngôn ngữ chúng ta nói để bộ nhận diện sẽ detect chính xác hơn. Ví dụ nếu bạn nói tiếng Việt thì chuyển ‘en-US’ về ‘vi-VN’. image.png

IV. Run project

Bằng câu lệnh: node index.js , bây giờ chúng ta đã có thể nói vào micro, Google APIs sẽ tự detect ra text và show kết quả lên console.

REFERENCE

https://medium.com/@khaleo/hướng-dẫn-build-ứng-dụng-sử-dụng-dịch-vụ-speech-to-text-của-google-cloud-trên-nodejs-79653d85f33

Cảm ơn các bạn đã xem bài viết!! ❤

Bình luận

Bài viết tương tự

- vừa được xem lúc

Giới thiệu Typescript - Sự khác nhau giữa Typescript và Javascript

Typescript là gì. TypeScript là một ngôn ngữ giúp cung cấp quy mô lớn hơn so với JavaScript.

0 0 528

- vừa được xem lúc

Bạn đã biết các tips này khi làm việc với chuỗi trong JavaScript chưa ?

Hi xin chào các bạn, tiếp tục chuỗi chủ đề về cái thằng JavaScript này, hôm nay mình sẽ giới thiệu cho các bạn một số thủ thuật hay ho khi làm việc với chuỗi trong JavaScript có thể bạn đã hoặc chưa từng dùng. Cụ thể như nào thì hãy cùng mình tìm hiểu trong bài viết này nhé (go).

0 0 437

- vừa được xem lúc

Một số phương thức với object trong Javascript

Trong Javascript có hỗ trợ các loại dữ liệu cơ bản là giống với hầu hết những ngôn ngữ lập trình khác. Bài viết này mình sẽ giới thiệu về Object và một số phương thức thường dùng với nó.

0 0 159

- vừa được xem lúc

Tìm hiểu về thư viện axios

Giới thiệu. Axios là gì? Axios là một thư viện HTTP Client dựa trên Promise.

0 0 149

- vừa được xem lúc

Imports và Exports trong JavaScript ES6

. Giới thiệu. ES6 cung cấp cho chúng ta import (nhập), export (xuất) các functions, biến từ module này sang module khác và sử dụng nó trong các file khác.

0 0 113

- vừa được xem lúc

Bài toán đọc số thành chữ (phần 2) - Hoàn chỉnh chương trình dưới 100 dòng code

Tiếp tục bài viết còn dang dở ở phần trước Phân tích bài toán đọc số thành chữ (phần 1) - Phân tích đề và những mảnh ghép đầu tiên. Bạn nào chưa đọc thì có thể xem ở link trên trước nhé.

0 0 249