Nesta página estão disponíveis outros formatos para os quais a Floresta Sintáctica foi exportada, mantidos pelo pólo de Braga.
O esquema do formato Tiger-XML foi desenvolvido pelo Projecto Tiger como linguagem de interface para o TIGERSearch. A sua especificação pode ser consultada no capítulo V do Manual do TIGERSearch 2.1.
O formato Penn Treebank é uma linguagem de anotação sintáctica, desenvolvido pelo Peen Treebank Project.
A Floresta Sintáctica é convertida para os formatos Tiger-XML e Penn Treebank, por scripts originalmente desenvolvidos por Eckhard Bick do projecto VISL, modificados pelo pólo de Braga da Linguateca.
O formato SQL da Floresta Sintáctica está em fase experimental. O código SQL é compatível com o PostgreSQL, em qualquer outra base de dados poderá ser necessário alterar ligeiramente a definição das tabelas.
O formato SimTreeML é XML. O formato Perl é uma Hash para programação sobre programas perl. Ambos os formatos são obtidos a partir de scripts desenvolvidos pelo José João Almeida do projecto Natura.
Mais informações sobre a Floresta Sintáctica estão disponíveis na página da Linguateca.
CETEMPúblico: Bosque_CP_8.0.PennTreebank.ptb.gz (1.1 MB)
CETENFolha: Bosque_CF_8.0.PennTreebank.ptb.gz (0.7 MB)
CETEMPúblico: Bosque_CP_7.4.PennTreebank.ptb.gz (1.1 MB)
CETENFolha: Bosque_CF_7.4.PennTreebank.ptb.gz (0.7 MB)
Floresta (Completa): Floresta_7.4.PennTreebank.ptb.gz (1.8 MB)
CETEMPúblico : Bosque_CP_8.0.TigerXML.xml.gz (3.0 MB)
CETENFolha : Bosque_CF_8.0.TigerXML.xml.gz (1.8 MB)
CETEMPúblico : Bosque_CP_7.4.TigerXML.xml.gz (3.0 MB)
CETENFolha : Bosque_CF_7.4.TigerXML.xml.gz (1.8 MB)
Floresta (Completa): Floresta_7.4.TigerXML.xml.gz (4.8 MB)
CETENFolha : Bosque_CF_7.4.sql.gz (1.8 MB)
CETEMPúblico : Bosque_CP_7.4.sql.gz (3.0 MB)
Floresta (Completa): Floresta_7.4.sql.xml.gz (4.8 MB)
CETEMPúblico : Bosque_CP_8.0.SimTreeML.xml.gz (1.6 MB)
CETENFolha : Bosque_CF_8.0.SimTreeML.xml.gz (0.9 MB)
CETEMPúblico : Bosque_CP_7.4.SimTreeML.xml.gz (1.6 MB)
CETENFolha : Bosque_CF_7.4.SimTreeML.xml.gz (0.9 MB)
CETEMPúblico : Bosque_CP_7.4.Perl.txt.gz (1.5 MB)
CETENFolha : Bosque_CF_7.4.Perl.txt.gz (0.8 MB)
Para o formato em Tiger-XML, está disponível o TIGERSearch, poderá fazer o download gratuito desta ferramenta gráfica, se estiver de acordo com a licença. Ver Screenshot de uma árvore da floresta.
Existem outros dois sistemas de interrogação disponíveis para a FS na Linguateca: o Águia e o Corpuseye.
As ferramentas utilizadas estão disponíveis em CVS
Validação automática das árvores : Validar bosques