‘Giọng nói chung’ của Mozilla – Cơ sở dữ liệu nguồn cộng đồng để cải thiện nhận dạng giọng nói

0

Tôi nhận được rất nhiều lời khen ngợi về giọng Scotland trầm ấm của mình nhưng khi nói đến các ứng dụng giọng nói như Siri và Alexa, giọng nói của tôi là một trách nhiệm hơn là một tài sản. Khi Apple và Amazon làm trợ lý giọng nói, họ dường như không có chuyên gia tư vấn giọng Scotland về quay số nhanh.

Nếu nhận dạng giọng nói được cho là con đường của tương lai – và được cho là nơi chúng ta phải hướng tới – thì các công cụ tìm kiếm và trợ lý giọng nói cần phải bắt đầu làm tốt hơn việc hiểu các trọng âm khó. Không phải tất cả chúng ta đều có giọng của học sinh tiếng Anh công cộng.

Mozilla (nhà sản xuất trình duyệt Firefox) đang cố gắng giải quyết vấn đề bằng cách yêu cầu mọi người tình nguyện đưa tiếng nói của họ vào cơ sở dữ liệu có tên “Common Voice”. Bằng cách khớp giọng nói để đặt các cụm từ, Mozilla hy vọng rằng cơ sở dữ liệu của họ cuối cùng sẽ là một công cụ vô giá trong tương lai cho bất kỳ ứng dụng nào tùy thuộc vào nhận dạng giọng nói.

Đăng ký ‘Common Voice’

Trước khi chúng ta đi xa hơn, chúng ta hãy giải quyết các vấn đề về quyền riêng tư trước, vì tôi có thể nghe thấy họ đến.

Mặc dù bạn có thể đăng ký bằng tài khoản Firefox, tài khoản Github hoặc tài khoản Google, nhưng thay vào đó bạn có thể đăng ký qua email. Chỉ cần mở một tài khoản email ẩn danh và sẽ không có ai là người khôn ngoan hơn bạn đang nói.

Khi bạn đã tạo tài khoản và đăng nhập, bạn sẽ thấy bảng điều khiển của mình.

Có hai phần – NóiNghe. Các Nói là nơi bạn được yêu cầu đóng góp tiếng nói của riêng mình. Nghe là nơi bạn lắng nghe giọng nói của những người khác và so sánh chúng với cụm từ mà họ phải nói. Sau đó, bạn sẽ chỉ ra nếu nó là chính xác.

Nói

Để tham gia phần nói, bạn sẽ cần một micrô hoạt động để thu giọng nói của bạn một cách rõ ràng. Bạn cũng cần cấp cho trang Mozilla quyền truy cập vào micrô đó.

Khi bạn nhấp vào Nói , bạn sẽ được cung cấp một bộ năm cụm từ ngẫu nhiên để nói. Hướng dẫn hiển thị rất rõ ràng trên màn hình và dễ làm theo.

Bạn chỉ cần nhấp vào biểu tượng micrô bên dưới và sau đó đọc câu bằng giọng nói bình thường của bạn. Đừng nói giọng không tự nhiên hoặc nói thật chậm.

Toàn bộ điểm của bài tập là cơ sở dữ liệu học cách hiểu các dân tộc nói giọng theo cách họ thường nói. Nói theo cách khác chỉ làm cho toàn bộ sự việc trở nên vô nghĩa.

Khi cụm từ đầu tiên đã được thực hiện xong, bạn sẽ thấy ở góc trên bên phải các tùy chọn để phát lại clip và quay lại clip nếu bạn không hài lòng với nó.

Nếu bạn hài lòng với nó, nó sẽ chuyển sang câu tiếp theo và tiếp tục cho đến khi hoàn thành tất cả năm cụm từ. Sau đó nhấp vào nút Gửi màu xanh lam để gửi clip của bạn tới Mozilla để kiểm tra.

Nếu bây giờ bạn quay lại trang tổng quan của mình, bạn sẽ thấy rằng bạn đã được ghi công cho những cụm từ đó.

Sau đó, đó là một trường hợp đơn giản là rửa sạch và lặp lại. Càng có nhiều đóng góp và các điểm nhấn khác nhau mà Mozilla có thể nhận được trong cơ sở dữ liệu của họ, thì dự án càng thành công.

Nghe

Khi mọi người đã gửi cụm từ của họ cho Mozilla, họ cần được kiểm tra để đảm bảo đoạn thoại khớp với cụm từ đó. Đây là một cái gì đó cũng đang được cung cấp cho các tình nguyện viên.

Quay lại trang tổng quan, bạn sẽ thấy Nghe phần bên phải. Bạn có thể thấy từ những người đóng góp hàng đầu phần mà một số thống kê nghiêm trọng đã được thống kê.

Để bắt đầu xác thực các cụm từ giọng nói, hãy chuyển đến Nghe và bạn sẽ được cung cấp một cụm từ và một nút phát.

Nhấp vào nút phát (đảm bảo rằng loa của bạn đang bật!) Và bạn sẽ nghe thấy giọng nói đã ghi. Nếu bạn quyết định cụm từ đã được nói chính xác, hãy nhấp vào Đúng. Nếu có sự phát âm sai, điều gì khác nói hoặc bất kỳ lỗi nào khác, hãy nhấp vào KHÔNG.

Phần kết luận

Đây chỉ là một trong nhiều dự án mà Mozilla đang thực hiện vào lúc này (hãy truy cập trang web chính của Mozilla và nhấp vào Dự án ở trên cùng – nó luôn thay đổi). Nguồn lực cộng đồng là một cách tuyệt vời để các dự án xứng đáng có thể xảy ra và bạn luôn xứng đáng đóng góp thời gian của mình để giúp xây dựng điều gì đó hữu ích cho tương lai.

Leave A Reply

Your email address will not be published.