5 Dịch vụ OCR Trực tuyến Miễn phí Đã được Kiểm tra và Đánh giá

0

Bạn có tài liệu PDF hoặc hình ảnh mà bạn muốn chuyển đổi thành văn bản? Gần đây, ai đó đã gửi cho tôi một tài liệu trong thư mà tôi cần chỉnh sửa và gửi lại với những chỉnh sửa. Người đó không thể tìm thấy một bản sao kỹ thuật số, vì vậy tôi được giao nhiệm vụ chuyển tất cả văn bản đó sang định dạng kỹ thuật số.

Không đời nào tôi lại mất hàng giờ để gõ lại mọi thứ, vì vậy tôi đã kết thúc việc chụp một bức ảnh chất lượng cao đẹp của tài liệu và sau đó lướt qua một loạt các dịch vụ OCR trực tuyến để xem cái nào sẽ cho tôi cái tốt nhất các kết quả.

Trong bài viết này, tôi sẽ điểm qua một số trang web yêu thích của tôi cho OCR miễn phí. Điều đáng chú ý là hầu hết các trang web này đều cung cấp dịch vụ cơ bản miễn phí và sau đó có các tùy chọn trả phí nếu bạn muốn các tính năng bổ sung như hình ảnh lớn hơn, tài liệu PDF nhiều trang, ngôn ngữ đầu vào khác nhau, v.v.

Cũng nên biết trước rằng hầu hết các dịch vụ này sẽ không thể khớp với định dạng của tài liệu gốc của bạn. Chúng chủ yếu là để trích xuất văn bản và thế là xong. Nếu bạn cần mọi thứ ở một bố cục hoặc định dạng cụ thể, bạn sẽ phải làm điều đó theo cách thủ công sau khi nhận được tất cả văn bản từ OCR.

Ngoài ra, kết quả tốt nhất để lấy văn bản sẽ đến từ các tài liệu có độ phân giải 200 đến 400 DPI. Nếu bạn có hình ảnh DPI thấp, kết quả sẽ không tốt.

Cuối cùng, có rất nhiều trang web tôi đã thử nghiệm không hoạt động. Nếu bạn sử dụng OCR trực tuyến miễn phí trên Google, bạn sẽ thấy một loạt các trang web nhưng một số trang web trong 10 kết quả hàng đầu thậm chí không hoàn thành chuyển đổi. Một số sẽ hết thời gian, một số khác sẽ xuất hiện lỗi và một số chỉ bị mắc kẹt trên trang “chuyển đổi”, vì vậy tôi thậm chí không bận tâm đến những trang web đó.

Đối với mỗi trang web, tôi đã kiểm tra hai tài liệu để xem kết quả đầu ra sẽ tốt như thế nào. Đối với các bài kiểm tra của mình, tôi chỉ cần sử dụng iPhone 5S để chụp ảnh cả hai tài liệu và sau đó tải chúng trực tiếp lên các trang web để chuyển đổi.

Trong trường hợp bạn muốn xem những hình ảnh mà tôi đã sử dụng cho bài kiểm tra của mình, tôi đã đính kèm chúng ở đây: Test1 và Test2. Lưu ý rằng đây không phải là phiên bản độ phân giải đầy đủ của hình ảnh được chụp từ điện thoại. Tôi đã sử dụng hình ảnh có độ phân giải đầy đủ khi tải lên các trang web.

OnlineOCR

OnlineOCR.net là một trang web sạch sẽ và đơn giản mang lại kết quả rất tốt trong bài kiểm tra của tôi. Điều chính tôi thích ở nó là nó không có hàng tấn quảng cáo khắp nơi, điều này thường xảy ra với những loại trang web dịch vụ thích hợp.

Để bắt đầu, hãy chọn tệp của bạn và đợi cho đến khi tải lên xong. Kích thước tải lên tối đa cho trang web này là 100 MB. Nếu đăng ký tài khoản miễn phí, bạn sẽ nhận được một số tính năng bổ sung như kích thước tải lên lớn hơn, tệp PDF nhiều trang, ngôn ngữ đầu vào khác nhau, nhiều chuyển đổi hơn mỗi giờ, v.v.

Tiếp theo, chọn ngôn ngữ đầu vào của bạn và sau đó chọn định dạng đầu ra. Bạn có thể chọn từ Word, Excel hoặc Văn bản thuần túy. Nhấn vào Đổi và bạn sẽ thấy văn bản được hiển thị ở dưới cùng trong hộp cùng với liên kết tải xuống.

ocr đầu ra

Nếu tất cả những gì bạn muốn là văn bản, chỉ cần sao chép và dán nó từ hộp. Tuy nhiên, tôi khuyên bạn nên tải xuống tài liệu Word vì nó thực hiện một công việc tuyệt vời đáng ngạc nhiên là giữ được bố cục của tài liệu gốc.

Ví dụ, khi tôi mở tài liệu Word để làm bài kiểm tra thứ hai, tôi đã rất ngạc nhiên khi thấy rằng tài liệu này bao gồm một bảng có ba cột, giống như trong hình.

đầu ra ocr trực tuyến

Trong số tất cả các trang web, trang này là tốt nhất cho đến nay. Nó hoàn toàn đáng để đăng ký nếu bạn cần thực hiện nhiều chuyển đổi.

Để hoàn chỉnh, tôi cũng sẽ liên kết đến các tệp đầu ra được tạo bởi từng dịch vụ để bạn có thể tự xem kết quả. Đây là kết quả từ OnlineOCR: Test1 Doc và Test2 Doc.

Lưu ý rằng khi mở các tài liệu Word này trên máy tính của bạn, bạn sẽ nhận được thông báo trong Word cho biết rằng nó từ Internet và tính năng chỉnh sửa đã bị tắt. Điều đó hoàn toàn ổn vì Word không tin tưởng vào các tài liệu từ Internet và bạn thực sự không cần phải bật chỉnh sửa nếu chỉ muốn xem tài liệu.

i2OCR

Một trang web khác cho kết quả khá tốt là i2OCR. Quá trình này rất giống nhau: chọn ngôn ngữ, tệp của bạn, sau đó nhấn Trích xuất văn bản.

i2ocr

Bạn sẽ phải đợi một hoặc hai phút ở đây vì trang web này mất nhiều thời gian hơn. Ngoài ra, trong Bước 2, hãy đảm bảo rằng hình ảnh của bạn hiển thị ở phía bên phải trong bản xem trước, nếu không bạn sẽ nhận được một loạt các chữ vô nghĩa khi xuất ra. Vì một số lý do, hình ảnh từ iPhone của tôi hiển thị ở chế độ dọc trên máy tính của tôi, nhưng nằm ngang khi tôi tải lên trang web này.

đầu ra i2ocr

Tôi phải mở hình ảnh theo cách thủ công trong một ứng dụng chỉnh sửa ảnh, xoay nó 90 độ, sau đó xoay nó trở lại chân dung và sau đó lưu lại. Sau khi hoàn tất, hãy cuộn xuống và nó sẽ hiển thị cho bạn bản xem trước của văn bản cùng với nút tải xuống.

Trang web này hoạt động khá tốt với kết quả đầu ra cho thử nghiệm đầu tiên, nhưng không hoạt động tốt với thử nghiệm thứ hai có bố cục cột. Đây là kết quả từ i2OCR: Test1 Doc và Test2 Doc.

FreeOCR

Free-OCR.com sẽ lấy hình ảnh của bạn và chuyển chúng thành văn bản thuần túy. Nó không có tùy chọn để xuất sang định dạng Word. Chọn tệp của bạn, chọn một ngôn ngữ và sau đó nhấp vào Khởi đầu.

Trang web nhanh và bạn sẽ nhận được đầu ra khá nhanh. Chỉ cần nhấp vào liên kết để tải tệp văn bản về máy tính của bạn.

freeocr

Như với NewOCR được đề cập bên dưới, trang web này viết hoa tất cả các chữ T trong tài liệu. Tôi không biết tại sao nó lại làm như vậy, nhưng vì một số lý do kỳ lạ mà trang web này và NewOCR đều đã làm điều này. Thay đổi nó không phải là một vấn đề lớn, nhưng đó là một quá trình tẻ nhạt mà bạn thực sự không nên làm.

Đây là kết quả từ FreeOCR: Test1 Doc và Test2 Doc.

ABBYY FineReader Trực tuyến

Để sử dụng FineReader Online, bạn phải đăng ký tài khoản, tài khoản này sẽ giúp bạn dùng thử miễn phí 15 ngày OCR lên đến 10 trang miễn phí. Nếu bạn chỉ cần thực hiện OCR một lần cho một vài trang, thì bạn có thể sử dụng dịch vụ này. Đảm bảo rằng bạn nhấp vào liên kết xác minh trong email xác nhận sau khi đăng ký.

máy đọc sách trực tuyến

Bấm vào Nhìn nhận ở trên cùng và sau đó nhấp vào Tải lên để chọn tệp của bạn. Chọn ngôn ngữ, định dạng đầu ra của bạn và sau đó nhấp vào Nhìn nhận ở dưới cùng. Trang web này có giao diện sạch sẽ và không có quảng cáo.

Trong các thử nghiệm của tôi, trang web này có thể lấy văn bản từ tài liệu thử nghiệm đầu tiên, nhưng nó hoàn toàn rất lớn khi tôi mở tài liệu Word, vì vậy cuối cùng tôi đã thực hiện lại và chọn Văn bản thuần túy làm định dạng đầu ra.

Đối với thử nghiệm thứ hai với các cột, tài liệu Word trống và tôi thậm chí không thể tìm thấy văn bản. Không chắc chắn những gì đã xảy ra ở đó, nhưng nó dường như không thể xử lý bất cứ điều gì ngoài các đoạn văn đơn giản. Đây là kết quả từ FineReader: Test1 Doc và Test2 Doc.

NewOCR

Trang tiếp theo, NewOCR.com, khá ổn, nhưng gần như không tốt bằng trang đầu tiên. Thứ nhất, nó có quảng cáo, nhưng may mắn thay, nó không phải là một tấn. Trước tiên, bạn chọn tệp của mình và sau đó nhấp vào Xem trước cái nút.

tải lên hình ảnh

Sau đó, bạn có thể xoay hình ảnh và điều chỉnh khu vực bạn muốn quét văn bản. Nó khá giống cách quá trình quét hoạt động trên máy tính có máy quét đi kèm.

hình ảnh ocr

Nếu tài liệu có nhiều cột, bạn có thể kiểm tra Phân tích bố cục trang và nó sẽ cố gắng chia văn bản thành các cột. Nhấp vào nút OCR, đợi một vài giây để hoàn thành và sau đó cuộn xuống cuối khi trang làm mới.

Trong bài kiểm tra đầu tiên, nó nhận được tất cả các văn bản một cách chính xác, nhưng vì một số lý do mà viết hoa mọi chữ T trong tài liệu! Không hiểu tại sao nó sẽ làm như vậy, nhưng nó đã làm. Trong thử nghiệm thứ hai với tính năng phân tích trang được bật, nó có phần lớn văn bản, nhưng bố cục hoàn toàn bị tắt.

Đây là kết quả từ NewOCR: Test1 Doc và Test2 Doc.

Phần kết luận

Như bạn có thể thấy, miễn phí không thực sự mang lại cho bạn kết quả tốt trong hầu hết thời gian. Trang web đầu tiên được đề cập là tốt nhất cho đến nay bởi vì nó không chỉ làm rất tốt việc nhận dạng tất cả văn bản mà còn quản lý để giữ lại định dạng của tài liệu gốc.

Tuy nhiên, nếu bạn chỉ cần văn bản, hầu hết các trang web ở trên sẽ có thể làm điều đó cho bạn. Nếu bạn có bất kỳ câu hỏi nào, hãy bình luận. Thưởng thức!

Leave A Reply

Your email address will not be published.