Dados

O release oficial da DBpedia mais recente é o 2016-10. Os dados da DBpedia Português foram obtidos a partir dos “dumps” da Wikipedia de Março/Abril e estão disponíveis através do site oficial.

Nós planejamos atualizações frequentes (ao menos semanais) para a DBpedia Português. No momento procuramos voluntários interessados em configurar as tarefas de extração no nosso servidor (treinamento será oferecido pela equipe da DBpedia Português e do comitê de internacionalização da DBpedia). Veja como participar.

Software

Na DBpedia, a extração de dados a partir da Wikipedia é realizado através do DEF (DBpedia Extraction Framework). Informações iniciais (em inglês) de como realizar a extração de dados para DBpedias internacionais estão disponíveis no guia de internacionalização (i18n).

Para realizar processamento de linguagem natural é necessário lidar com problemas de ambiguidade no texto. Por exemplo, a palavra ‘Cruzeiro’ pode ter significados diferentes dependendo se for utilizada no contexto monetário ou no contexto de futebol. A ferramenta DBpedia Spotlight é uma ferramenta que visa automatizar a ‘desambiguação’ de textos em linguagem natural. Mais informações: http://www.dbpedia-spotlight.org