>> Lançamento da versão 2016-04 da DBpedia

A versão 2016-04 baseada nos dumps de Março/Abril de 2016 da Wikipedia acaba de ser lançada, contendo um significativo avanço na base de informações com dados mais ricos e (esperadamente) mais limpos, baseados na ontologia da DBpedia.

Você pode baixar o novo dataset da DBpedia numa variedade de formatos RDF através do site: http://wiki.dbpedia.org/downloads-2016-04 ou diretamente em http://downloads.dbpedia.org/2016-04/.

Ajude a DBpedia

Durante a última reunião da DBpedia em Leipzig na Alemanha, nós discutimos formas de ajudar a DBpedia e quais os benefícios que este apoio pode trazer. A prioridade hoje é comprar um novo servidor para o DBpedia Spotlight que atualmente é hospedado gentilmente por terceiros - Um especial obrigado ao Instituto de Computação da Academia de Ciências da Hungria.

Se você utiliza a DBpedia e quer nos ajudar a manter este trabalho, convidamos gentilmente a fazer uma doação ou se tornar um membro da DBpedia association.

Estatísticas

A versão inglesa da base de conhecimento da DBpedia descreve atualmente 6.0M de entidades, dos quais 4.6M possuem resumos (abstracts), 1.53M possuem coordenadas geográficas, além 1.6M em imagens / fotos. No total, temos 5.2M de recursos classificados em uma ontologia consistente, contendo 1.5M descrições de pessoas, 810K descrições de lugares (incluindo 505K descrições de capitais / regiões populosas), 490K em obras (incluindo 135K de álbuns musicais, 106K em filmes e 20K de vídeo games), 275K organizações (incluindo 67K em empresas e 53K instituições educacionais), 301K espécies e 5K em doenças. O número total de recursos da DBpedia Inglesa totaliza 16.9M, além de 6.0M em recursos, incluindo 1.7M conceitos skos (categorias), 7.3M páginas de redirecionamento, 260K páginas de desambiguação e 1.7M em nós intermediários.

No total, a DBpedia 2016-04 consiste em 9.5 bilhões (2015-10: 8.8 bilhões) de triplas dos quais 1.3 bilhões (2015-10: 1.1 bilhões) foram extraídas da versão inglesa da Wikipedia, 5.0 bilhões (2015-04: 4.4 bilhões) foram extraídos de outras edições do idioma e 3.2 bilhões (2015-10: 3.2 bilhões) da DBpedia Commons e da Wikidata. No geral, foi observado um crescimento dos mapeamentos de aproximadamente 2%.

As estatísticas completas podem ser encontradas no site da DBpedia, sendo que as informações gerais dos datasets podem ser encontradas aqui

Comunidade

A comunidade DBpedia adicionou novas classes e propriedades a ontologia da DBpedia utilizando o mappings wiki. A DBpedia 2016-04 é compostas de:

  • 754 classes (DBpedia 2015-10: 739)
  • 1,103 object properties (DBpedia 2015-10: 1,099)
  • 1,608 datatype properties (DBpedia 2015-10: 1,596)
  • 132 specialized datatype properties (DBpedia 2015-10: 132)
  • 410 owl:equivalentClass e 221 owl:equivalentProperty em mapeamentos para vocabulários externos(DBpedia 2015-04: 407 - 221)

O trabalho realizado no mappings wiki definiu também muitos novos mapeamentos a partir dos templates Wikipedia para as classes DBpedia. Para esta extração, nós utilizamos um total de 5800 templates de mapeamento (DBpedia 2015-10: 5553). Pela segunda vez, o idioma que possui o maior número de mapeamentos é o Holandês com 646 mapeamentos, seguido pelo idioma inglês com 604 mapeamentos

Agradecimentos

Markus Freudenberg (University of Leipzig / DBpedia Association) por estar a cargo de todo o processo de release e publicação da versão, bem como da página de estatísticas.

Dimitris Kontokostas (University of Leipzig / DBpedia Association) por transmitir seu considerável conhecimento no processo de extração e release

A todos os editores que contribuiram mapeando a ontologia da DBpedia via Mappings wiki.

Ao comitê de internacionalização da DBpedia por apoiar o processo

Heiko Paulheim (University of Mannheim) por fornecer o código necessário para gerar tipos adicionais aos recursos anteriormente sem tipos, identificando e removendo os incorretos que agora faz parte do DIEF.

Václav Zeman e todo o time do LHD (University of Prague) por sua contribuição na adição de tipos

Marco Fossati (FBK) por contribur com os tipos DBTax

Alan Meehan (TCD) por executar uma grande limpeza nos links externos.

Aldo Gangemi (Universidade LIPN , França & ISTC-CNR, Itália) por fornecer os links do DOLCE para a ontologia da DBpedia.

Kingsley Idehen, Patrick van Kleef, e Mitko Iliev (OpenLink Software) por carregar todos os dados na instância do Virtuoso e prover os serviços para publicação de dados ligados e o endpoint para o SPARQL.

A OpenLink Software por prover os serviços SPARQL e a infraestrutura para publicar os dados ligados da DBpedia, além do contínuo suporte a infraestrutura.

Ruben Verborgh da Universidade de Ghent – iMinds por publicar o dataset como Triple Pattern Fragments, e iMinds for financiar o DBpedia’s Triple Pattern Fragments server.

Ali Ismayilov (Universidade de Bonn) por expandir o dataset da DBpedia Wikidata.

Vladimir Alexiev (Ontotext) por liderar com sucesso o esforço de mapeamento e limpeza da ontologia.

A todos os estudates que participaram do GSoC e seus mentores que participaram direta ou indiretamente desta entrega.

Um agradecimento especial a todos os membros da DBpedia Association, ao AKSW e ao departamento de Business Information Systems da Universidade de Leipzig.

O trabalho da DBpedia 2016-04 foi financeiramente suportado pela comissão Europeia através do projeto ALIGNED – quality-centric, software and data engineering.

Mais informações sobre a DBpedia podem ser encontradas no site http://dbpedia.org, bem como as publicações relacionadas ao projeto podem ser lidas http://wiki.dbpedia.org/Publications.

Divirta-se e aproveite a DBpedia 2016-04!