A linguagem Markdown tem vindo a ganhar bastante popularidade nos últimos anos, e tende a ser uma aposta para quem pretenda criar documentos “universais”, que fiquem bem em qualquer formato e dispositivo. Ao mesmo tempo, esta linguagem é mais simples de ler e estruturar, sendo perfeita para longos documentos que necessitam de diferentes formatações.
Embora existam algumas formas de converter documentos para o formato Markdown, nem todos são perfeitos, e ainda existem falhas que podem afetar os resultados finais. No entanto, a Microsoft acaba de revelar um novo projeto que pretende ajudar nessa tarefa.
A empresa revelou recentemente o projeto MarkItDown, que pretende ser um script em Python, focado para ajudar os utilizadores a rapidamente converterem os documentos do Office para Markdown.
O script atualmente suporta um vasto conjunto de ficheiros, embora esteja otimizado para documentos criados no Office. Porém, pode ainda ser usado em ficheiros PDF, imagens, Áudio, HTML e outros formatos de texto.
Os programadores podem ainda configurar o MarkItDown para funcionar com modelos LLM, integrando as suas próprias capacidades de Inteligência Artificial no mesmo, e até para criar projetos maiores onde o script seja a base.
O MarkItDown encontra-se disponível com uma licença MIT, pelo que pode ser livremente usado por outros utilizadores nos seus projetos, e poderá ser inteiramente modificado e distribuído. O único requisito será que a licença original MIT deve ser mantida em todas as criações derivadas do mesmo.
Os interessados podem analisar mais detalhes sobre o projeto diretamente do GitHub.
Nenhum comentário
Seja o primeiro!