CIN 936 - Representação e Recuperação da Informação Digital

Programa de Pós-Graduação em Ciência da Informação (PPGCI-UFPE)

PLANO DE ENSINO DA DISCIPLINA: Representação e Recuperação da Informação Digital
Carga Horária Teórica: 60h
Carga Horária Prática: -
Créditos: 04

PERÍODO LETIVO (ANO.SEMESTRE): 2026.1

CURSO QUE ATENDE:
Mestrado em Ciência da Informação, Doutorado em Ciência da Informação
HORÁRIO: 4ª feiras – 08:00h às 12:00h

LOCAL: Sala 6/LABINF

PROFESSOR: Renato Fernandes Corrêa

EMENTA
Aspectos teóricos e técnicos envolvidos na representação para fins de busca e recuperação do conhecimento registrado em artigos científicos de periódicos eletrônicos.

OBJETIVO
Compreensão dos aspectos teóricos e técnicos envolvidos na representação para fins de busca e recuperação do conhecimento registrado em artigos científicos de periódicos eletrônicos.

CONTEÚDO PROGRAMÁTICO
. Indexação e Recuperação de Informação.
. Indexação automática.
. Indexação automática e Processamento de Linguagem Natural.
. Indexação automática e Mineração de textos.
. Sistemas de indexação automática.
. Avaliação da indexação automática.
. Seminários, experimentos e aplicações.

METODOLOGIA
Consiste de 15 encontros semanais com 4 horas de duração, correspondendo a 4 aulas em cada encontro.
Aulas expositivas e participativas, envolvendo debates, discussões e apresentação de seminários.

AVALIAÇÃO
A disciplina possuirá duas avaliações. A primeira será a elaboração e apresentação de resenha sobre um artigo científico e a segunda será a redação e apresentação de um artigo científico sobre o assunto indexação automática. Cada avaliação será pontuada de 0 a 10. A média final será a soma das avaliações dividindo-se o resultado por dois. As notas serão convertidas para conceitos utilizando os seguintes intervalos: A [9 a 10], B [8 a 9), C [7 a 8) , e D.

BIBLIOGRAFIA BÁSICA

BAEZA-YATES, R.; RIBEIRO-NETO, B.. Recuperação de informação: conceitos e tecnologia das máquinas de busca. 2. ed. Porto Alegre: Bookman, 2013. ISBN 9788582600481.

CASELI, H.M.; NUNES, M.G.V. (org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. BPLN, 2023. ISBN: 9786500806939. Disponível em: https://brasileiraspln.com/livro-pln/1a-edicao/.


GIL-LEIVA, I.. Manual de indización. Teoría y práctica. Gijón: Trea, 2008. pp. 429. ISBN:9788497043670.

GIL LEIVA, Isidoro. Aspectos conceituais da indexação. In: GIL LEIVA, Isidoro; FUJITA, Mariângela Spotti Lopes (ed.). Política de indexação. São Paulo: Cultura Acadêmica; Marília: Oficina Universitária, 2012. p. 31-105.

GOLDSCHMIDT, R.; PASSOS, E. L.; BEZERRA, E.. Data mining: uma guia prático: conceitos, técnicas, ferramentas, orientações e aplicações. Segunda Edição. Rio de Janeiro: Elsevier, 2015. ISBN: 8535278222.

LANCASTER, F.W. Indexação e resumos: teoria e prática. Brasília: Brinquet de Lemos/Livros, 2004.

BIBLIOGRAFIA COMPLEMENTAR

GOLUB, K. Automated Subject Indexing: An Overview. Cataloging & Classification  Quarterly, v. 59, n. 8, p. 702-719, 2021. DOI: 10.1080/01639374.2021.2012311.

GOLUB, K.; SOERGEL, D.; BUCHANAN, G.; TUDHOPE, D.; LYKKE, M.; HIOM, D. A framework for evaluating automatic indexing or classification in the context of retrieval. Journal of the Association for Information Science and Technology (JASIST), v. 67, n.1, p. 3-16, 2016. DOI: 10.1002/asi.23600.

MARTIN, J. H.; JURAFSKY, D. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition - 2.ed. - New jersey: Pearson Education Inc., 2009.

REZENDE, S. O. Sistemas Inteligentes: fundamentos e aplicações. Editora Manole, 2003.

WITTEN, I. H.; FRANK, Eibe; HALL, Mark A. Data mining: practical machine learning tools and techniques. 3rd ed. Burlington, MA: Elsevier/Morgan Kaufmann, 2011.


Artigos de revisão sobre Indexação automática

FUJITA, M. S. L.; SOUZA, N. M. T. VOCABULÁRIO CONTROLADO E INTELIGÊNCIA ARTIFICIAL NA INDEXAÇÃO: UMA REVISÃO BIBLIOGRÁFICA. Perspect. Ciênc. Inf., v. 30, 2025, DOI: 10.1590/1981-5344/56745

NASCIMENTO, G. D.; MARTINS, G. K.; ALBUQUERQUE, M. E. B. C. AUTOMAÇÃO DA INDEXAÇÃO: EVIDÊNCIAS E TENDÊNCIAS DA PRODUÇÃO CIENTÍFICA INDEXADA NA BRAPCI. Encontros Bibli, v.28, 2023. DOI: 10.5007/1518-2924.2023.e91956 

SILVA, S. R. B.; CORREA, R. F. Sistemas de Indexação automática por atribuição: uma análise comparativa. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, [S. l.], v. 25, p. 1-25, 2020. DOI: 10.5007/1518-2924.2020.e70740.

NASCIMENTO, G. D. ; CORREA, R. F. Seleção de sintagmas nominais na indexação automática. Encontros Bibli (UFSC), v. 24, p. 1-19, 2019. DOI: 10.5007/1518-2924.2019.e57927 

MAIA, E. H. B.; BAX, M. P. Um estudo bibliográfico sobre ligação de entidades. Informação & Informação, v. 21, n. 2, 2016. DOI:10.5433/1981-8920.2016v21n2p245. Disponível em: <http://brapci.inf.br/index.php/article/view/22158>. Acesso em: 05 Jun. 2018.

BORGES, G. S. B.; LIMA, G. N. B. M. O. Desenvolvimento de softwares de indexação automática: breve avaliação dos principais critérios. Informação & Tecnologia, v. 2, n. 2, 2015. Disponível em: <http://brapci.inf.br/index.php/article/view/23098>. Acesso em: 05 Jun. 2018.

LAPA, R.; CORRÊA, R. F. Indexação automática no âmbito da ciência da informação no brasil. Informação & Tecnologia, v. 1, n. 2, p. 59-76, 2014. Disponível em: <http://brapci.inf.br/index.php/article/view/16346>. Acesso em: 05 Jun. 2018.

CORRÊA, R. F.; LAPA, R. C. Panorama de estudos sobre indexação automática no âmbito da ciência da informação no brasil (1973-2012). Ciência da Informação, v. 42, n. 2, 2013. Disponível em: <https://brapci.inf.br/index.php/res/v/20714>. Acesso em: 05 Jun. 2018.

BORGES, Graciane Silva Bruzinga; MACULAN, Benildes Coura Moreira dos Santos; LIMA, Gercina Ângela Borém de Oliveira. Indexação automática e semântica: estudo da análise do conteúdo de teses e dissertações. Informação & Sociedade: Estudos, João Pessoa, v. 18, n. 2, p. 181-193, maio/ago. 2008. Disponível em: <http://brapci.inf.br/index.php/article/view/5050>. Acesso em: 05 Jun. 2018.


 Artigos sobre Indexação automática com propostas teóricas de expansão de termos via ontologia

SIMOES, M. G. A. M. et al. Indexação automática e ontologias: identificação dos contributos convergentes na ciência da informação. Ciência da Informação, v. 46, n. 1, 2017. Disponível em: <http://brapci.inf.br/index.php/article/view/29197>. Acesso em: 05 Jun. 2018.

FERNEDA, E.; DIAS, G. A. Ontosmart: um modelo de recuperação de informação baseado em ontologia. Perspectivas em Ciência da Informação, v. 22, n. 2, 2017. Disponível em: <http://brapci.inf.br/index.php/article/view/23453>. Acesso em: 05 Jun. 2018.

NETO, J. J.; FERNEDA, E. Ontologia como recurso de padronização terminológica no processo de recuperação de informação. Informação em Pauta, v. 1, n. 1, p. 30-45, 2016. Disponível em:  <http://hdl.handle.net/20.500.11959/brapci/41073. Acesso em: 04 jun. 2020.

NICOLINO, M. E. V. P.; FERNEDA, E. Um método para a utilização de ontologias na indexação automática. Informação & Tecnologia, v. 1, n. 2, p. 13-33, 2014. Disponível em: <https://brapci.inf.br/#/v/41793>. Acesso em: 05 Jun. 2018.


Artigos sobre aplicações da Indexação Automática

CORREA, R. F.; FUJITA, M. S. L. . Método para avaliação direta da indexação automática via julgamento por indexadores. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, [S. l.], v. 29, p. 01–29, 2024. DOI: 10.5007/1518-2924.2024.e96485. Disponível em: https://periodicos.ufsc.br/index.php/eb/article/view/96485. Acesso em: 11 mar. 2024.

BRITO, J. C. B.; MARTINS, D. L. Framework genérico para geração automática de assuntos e indexação em repositório digital. Perspectivas em Ciência da Informação, [S. l.], v. 28, n. Fluxo Contínuo, p. e46629, 2023. Disponível em: https://periodicos.ufmg.br/index.php/pci/article/view/46629. Acesso em: 11 mar. 2024.

CORREA, R. F. ; FERREIRA, M. H. W. . Sistematização da obtenção de indicadores temáticos de informação científica. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, [S. l.], v. 28, p. 1–30, 2023. DOI: 10.5007/1518-2924.2023.e92070. Disponível em: https://periodicos.ufsc.br/index.php/eb/article/view/92070. Acesso em: 11 mar. 2024.

GIL-LEIVA, I.; ORTUÑO, P. D.; CORRÊA, R. F. Indización automática de artículos científicos sobre Biblioteconomía y Documentación con SISA, KEA y MAUI. Revista Española de Documentación Científica, [S. l.], v. 45, n. 4, p. e338, 2022. DOI: 10.3989/redc.2022.4.1917.

SILVA, S. R. de B. .; CORREA, R. F. .; GIL-LEIVA, I. . Avaliação direta e conjunta de Sistemas de Indexação Automática por Atribuição. Informação&Sociedade, [S. l.], v. 30, n. 4, p. 1–27, 2021. DOI: 10.22478/ufpb.1809-4783.2020v30n4.57259. Disponível em: https://periodicos.ufpb.br/ojs2/index.php/ies/article/view/57259. Acesso em: 11 mar. 2024.

SILVA, B. F. M.; CORRÊA, R. F. Aplicação da folksonomia assistida na construção de corpus de referência em ciência da informação. Em Questão, v. 26, n. 2, p. 413-436, 2020. DOI: 10.19132/1808-5245262.413-436.

KATAHIRA, I.; FUJITA, M.; GIL LEIVA, I.; ALVES, R.. ESTRATÉGIAS PARA SELEÇÃO DE TERMOS DO SISTEMA DE INDEXAÇÃO SISA. Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB), n. XX, Brasil, 2019. Disponível em: <https://conferencias.ufsc.br/index.php/enancib/2019/paper/view/885/792>. Data de acesso: 04 Jun. 2020.

CORRÊA, R. F.; CELERINO, V. G. . Método de normalização de sintagmas nominais na indexação automática. EM QUESTÃO, v. 25, p. 321-344, 2019. DOI:http://dx.doi.org/10.19132/1808-5245251.321-344

BANDIM, M. A. S. ; CORREA, R. F. . Indexação automática por atribuição de artigos científicos em português da área de Ciência da Informação. Transinformacao, v. 31, p. 1-12, 2019. DOI:http://dx.doi.org/10.1590/2318-0889201931e180004

BANDIM, M. A. S. ; CORRÊA, R. F. . A consistência na indexação automática por atribuição de artigos científicos na área de Ciência da Informação. Encontros Bibli (UFSC), v. 23, p. 64-77, 2018. DOI:http://dx.doi.org/10.5007/1518-2924.2018v23n53p64 

NASCIMENTO, G. D.; CORREA, R. F. . Avaliação de critérios para seleção de sintagmas nominais com valor para a recuperação da informação. Transinformacao, v. 30, p. 179-192, 2018. DOI:http://dx.doi.org/10.1590/2318-08892018000200004

GIL-LEIVA, Isidoro. SISA: Automatic indexing system for scientific articles. Experiments with location heuristics rules versus TF-IDF rules. Knowledge Organization, 2017, vol. 44, nº 3, p. 139-162. Disponível em: <https://webs.um.es/isgil/resources/SISA%20Automatic%20indexing%20Gil-Leiva2017.pdf>. Acesso em: 11 Mai. 2020.

CORRÊA, R. F.; BAZILIO, L. H. T. Análise da extração de descritores como sintagmas nominais através do software ogma. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, v. 22, n. 50, 2017. Disponível em: <http://brapci.inf.br/index.php/article/view/26999>. Acesso em: 05 Jun. 2018.

SOUZA, R. R; RAGHAVAN, K. Extraction of Keywords from Texts: An Exploratory study using Noun Phrases. Informação & Tecnologia, v. 1, n. 1, p. 5-16, 2014. Disponível em: <http://brapci.inf.br/index.php/article/view/15114>. Acesso em: 05 Jun. 2018.

SILVA, E. M.; SOUZA, R. R. Fundamentos em processamento de linguagem natural: uma proposta para extração de bigramas. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, v. 19, n. 40, 2014. DOI: 10.5007/1518-2924.2014v19n40p1.

CORRÊA, R. F. et al. Indexação e recuperação de teses e dissertações por meio de sintagmas nominais. AtoZ: Novas Práticas em Informação e Conhecimento, v. 1, n. 1, p. 11-22, 2011. Disponível em: <http://brapci.inf.br/index.php/article/view/11000>. Acesso em: 05 Jun. 2018.

NARUKAWA, C. M.; LEIVA, I. G.; FUJITA, M. N. S. L. Indexação automatizada de artigos de periódicos científicos: análise da aplicação do software sisa com uso da terminologia decs na área de odontologia. Informação & Sociedade: Estudos, v. 19, n. 2, p. 99-118, 2009. Disponível em: <http://brapci.inf.br/index.php/article/view/7566>. Acesso em: 05 Jun. 2018.

LIMA, V. N. M. A.; BOCCATO, V. R. C. O desempenho terminológico dos descritores em ciência da informação do vocabulário controlado do sibi/usp nos processos de indexação manual, automática e semi-automática. Perspectivas em Ciência da Informação, v. 14, n. 1, p. 131-151, 2009. Disponível em: <http://brapci.inf.br/index.php/article/view/6580>. Acesso em: 05 Jun. 2018.

SOUZA, R. R. Uma proposta de metodologia para indexação automática utilizando sintagmas nominais. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, v. 11, n. esp., p. 42-59, 2006. Disponível em: <http://dx.doi.org/10.5007/1518-2924.2006v11nesp1p42>. Acesso em: 05 Jun. 2018. 

ALCAIDE, G. S. et al. Análise comparativa e de consistência entre representações automática e manual de informações documentárias. Transinformação, v. 13, n. 1, 2001. Disponível em: <http://brapci.inf.br/index.php/article/view/20235>. Acesso em: 05 Jun. 2018.


Categorização automática

MEIRELES, M. R. G. A.; CENDÓN, B. V.; ALMEIDA, P. E. M. Comparação do processo de categorização de documentos utilizando palavras-chave e citações em um domínio de conhecimento restrito. Transinformação, v. 28, n. 1, 2016. Disponível em: <http://brapci.inf.br/index.php/article/view/29609>. Acesso em: 05 Jun. 2018.

GOMES, G. R. R.; MORAES FILHO, R. O. Cadweb - categorização automática de documentos digitais. Ciência da Informação, v. 40, n. 1, p. 68-76, 2011. Disponível em: <http://brapci.inf.br/index.php/article/view/11744>. Acesso em: 02 Ago. 2018.

MAIA, L. C.; SOUZA, R. R. Uso de sintagmas nominais na classificação automática de documentos eletrônicos. Perspectivas em Ciência da Informação, v. 15, n. 1, p. 154-172, 2010. Disponível em: <http://brapci.inf.br/index.php/article/view/8768>. Acesso em: 05 Jun. 2018.



CRONOGRAMA DA DISCIPLINA:

 DataEncontro  Assunto Recurso
 04/mar 01 Apresentação do Plano de Ensino. 

 Determinação de artigos científicos para elaboração de resenha e apresentação em seminário. (Vide sugestões na Bibliografia Complementar ou localize nas bases de artigos de periódicos)
Onde encontrar artigos de periódicos eletrônicos de CI: 

 11/mar 02 Indexação e Recuperação da Informação

 slides 01
  
 18/mar 03 Atividade remota de elaboração de resenha no formato de resumo expandido - Atividade Prática Supervisionada (APS) 

 25/mar 04  Indexação automática:
  Delimitação conceitual;
  Ferramentas e métodos para indexação automática;
  Sistemas de indexação automática.
 slides 02


 01/abr 05  Avaliação da indexação automática slides 03

 08/abr 06 SISA: Sistema de Indexação Semiautomático slides 04
 15/abr 07  ANNIF slides 05
 22/abr    08  Atividade remota de preparação para o primeiro seminário sobre indexação automática - Atividade Prática Supervisionada (APS).
Entrega das resenhas e slides dos seminários.

 As apresentações devem ter duração de 15 minutos (use no máximo 15 slides), deve contemplar as seções do resumo expandido e detalhar mais o método, resultados e conclusão.

 
 29/abr 09 Avaliação 1 – Seminários sobre a Indexação automática na Ciência da Informação 
 06/mai 10 Experimentos de indexação automática  slides 06
 13/mai 11  Atividade remota de elaboração  de resumo estruturado.

 Entrega do resumo estruturado.

 20/mai 12 Atividade remota de retorno sobre o resumo estruturado e orientações na escrita do resumo expandido.
 27/mai 13 Atividade remota de escrita do resumo expandido.
Orientações na construção do Resumo Expandido: cinco a sete páginas incluindo Bibliografia no formato ABNT; margens 2-2-2-2 cm, fonte Times New Roman 12pt, espaçamento simples entre linhas; conteúdo segundo norma ABNT para resumo, atentando principalmente para os objetivos do trabalho, justificativa, trabalhos relacionados, metodologia, os resultados e as conclusões.
 O resumo expandido deve contemplar as subseções: Introdução (contexto do trabalho, objetivos do trabalho, justificativa); Trabalhos relacionados (discussão dos conceitos fundamentais e trabalhos relacionados); Metodologia (a metodologia científica do trabalho), Resultados (análise dos resultados do trabalho),   Conclusão (principais conclusões, limitações e trabalhos futuros) e Referências
 03/jun 14   Atividade remota para o segundo seminário

Entrega do resumo expandido e da apresentação. 

As apresentações devem ter duração de 15 minutos (use no máximo 15 slides), deve contemplar as seções do resumo expandido e detalhar mais o método, resultados e conclusão.
 10/jun 15 Avaliação 2 - Seminários sobre indexação automática.
 Apresentação dos resumos expandidos (apresentações de 15 minutos).
 17/jun  Entrega das notas finais

Nenhum comentário:

Postar um comentário

Cursos de Tecnologia da Informação online

Vários ambientes virtuais de aprendizagem oferecem cursos online relacionados com a gestão da informação e biblioteconomia. Para quem d...