1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

Mistral AI OCR 3

A tecnologia de reconhecimento ótico de caracteres (OCR) acaba de receber um impulso significativo com o anúncio da mais recente inovação da Mistral. A empresa revelou o Mistral OCR 3, um modelo concebido para estabelecer novos padrões de precisão e eficiência no processamento de documentos, capaz de extrair texto e imagens com uma fidelidade sem precedentes.

Esta nova versão destaca-se pela capacidade de fornecer saídas em Markdown, juntamente com a reconstrução de tabelas baseada em HTML. Esta funcionalidade permite que os sistemas a jusante preservem não apenas o conteúdo, mas também a estrutura original do documento, algo essencial para a digitalização moderna e fluxos de trabalho de inteligência artificial.

Superioridade em cenários complexos

Segundo os dados partilhados pela Mistral, o novo modelo supera largamente o seu antecessor, alcançando uma taxa de sucesso superior em 74% face ao Mistral OCR 2 em domínios desafiantes. Estes cenários incluem formulários, documentos digitalizados, tabelas complexas e até escrita manual.

O OCR 3 apresenta melhorias significativas na interpretação de escrita cursiva, anotações de conteúdo misto e entradas manuscritas sobrepostas em formulários impressos. Além disso, a deteção de caixas, etiquetas e esquemas densos foi aprimorada. A robustez do modelo também foi reforçada, oferecendo agora uma maior resistência a artefactos de compressão, inclinação, distorção de documentos, baixa resolução (DPI) e ruído de fundo.

Um dos pontos fortes desta atualização reside na reconstrução avançada de tabelas. O modelo suporta agora o reconhecimento de cabeçalhos, células fundidas, blocos de várias linhas e hierarquias baseadas em colunas, garantindo que a informação estruturada é mantida intacta após o processamento.

Acessibilidade e preços competitivos

A empresa disponibilizou o novo modelo através de integração API ou através da interface de utilizador atualizada Document AI no Mistral AI Studio. Esta flexibilidade permite uma extração instantânea tanto em texto simples como em JSON estruturado, servindo as necessidades de programadores e utilizadores empresariais.

A atualização abrange todos os idiomas e tipos de documentos suportados. Em termos de custos, o preço começa nos 2 dólares por cada 1.000 páginas, descendo para 1 dólar em modo de lote (batch mode). Para garantir uma transição suave para os atuais utilizadores, o Mistral OCR 3 é totalmente retrocompatível com a versão OCR 2.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech