Sistema de integração e recomendação de itens de acervos de bibliotecas brasilianas

Trabalho de Formatura Supervisionado

Clique AQUI para acessar a monografia.

Contextualização

O trabalho proposto é parte do projeto intitulado ''Brasiliana Inteligente'', que é um consórcio de bibliotecas (ainda em formação) liderado pela Profa. Dra. Diana Vidal, diretora do Instituto de Estudos Brasileiros (IEB) da USP, e que tem a participação também da Biblioteca Brasiliana Guita e José Mindlin.

Uma biblioteca brasiliana, de acordo com com Rubens Borba de Moraes, é uma coleção que reúne livros de autores brasileiros, impressos no Brasil e no exterior, bem como livros sobre o Brasil escritos por autores estrangeiros, impressos dentro ou fora do Brasil (Antunes, 2017). Segundo a Biblioteca Brasiliana Guita e José Mindlin, uma biblioteca brasiliana tem o compromisso de conservar e divulgar o acesso ao acervo, promovendo a disseminação de assuntos brasileiros. O acervo compreende lvros, documentos, áudios, vídeos, etc.

O Instituto de Estudos Brasileiros (IEB), criado em 1962 por Sérgio Buarque de Holanda, é um centro multidisciplinar de pesquisas e documentação sobre a história e as culturas do Brasil. É considerada uma das bibliotecas mais ricas em assuntos brasileiros, com aproximadamente 250 mil volumes, incluindo livros, separatas, teses e periódicos.

A Biblioteca Brasiliana Guita e José Mindlin é um órgão da Pró-Reitoria de Cultura e Extensão Universitária da Universidade de São Paulo (USP) que abriga e integra a coleção brasiliana reunida ao longo de mais de oitenta anos pelo bibliófilo José Mindlin e sua esposa Guita.

Caracterização do problema

Dissociação das bibliotecas brasilianas

Em função de existirem diferentes bibliotecas que têm o Brasil como temática, um aluno ou pesquisador que necessite encontrar um item raro terá que consultar (ou se dirigir a) diversas bibliotecas para encontrá-lo, uma vez que não existe um sistema que integre todas elas.

Em consequência, cada biblioteca tem um método de busca próprio, sendo necessário um entendimento de diversas ferramentas de busca, o que não seria necessário se as bibliotecas estivessem integradas em apenas um sistema.

Objetivo

A proposta deste Trabalho de Formatura Supervisionado é criar um repositório integrado de metadados de acervos de bibliotecas brasilianas, com um banco de dados e uma aplicação que permita aos usuários consultar informações sobre o acervo. Será produzido, também, um sistema de recomendação para os pesquisadores que se dedicam ao estudo de assuntos brasileiros.

Metodologia

Banco de dados

O banco de dados será criado com o propósito de permitir a integração das bibliotecas Brasilianas da USP com outras bibliotecas Brasilianas do país e de fora dele e, assim, ampliar a visibilidade dos seus acervos.

O modelo de banco de dados que pretende-se usar neste projeto é o orientado a grafos, um tipo de modelo usado em sistemas de bancos de dados NoSQL (ou seja não relacional). Nos bancos de dados de grafos, os relacionamentos entre os dados são representados de forma explicita, através de um modelo com vértices (entidades) e arestas (relacionamentos) (Penteado, 2014). Esse tipo de banco de dados nos fornecerá uma modelagem mais simples e com melhor performance para consultas para a busca de itens dos acervos e também para apoio ao sistema de recomendação.

Neo4j

O sistema de gerenciamento de banco de dados em grafos mais usado na atualidade é o Neo4j, que é um sistema transacional compatível com modelo ACID. Um sistema transacional ACID é aquele que garante às transações que gerencia quatro propriedades -- Atomicidade, Consistência, Isolamento e Durabilidade (do inglês Atomicity, Consistency, Isolation, Durability). Esse é o modelo transacional implementado pelos sistemas gerenciadores de bancos de dados relacionais. O Neo4j é um banco de dados de grafos altamente escalonável que utiliza um mecanismo nativo de armazenamento e processamento de grafos, oferecendo um banco de dados intuitivo, flexível e seguro (Webber, 2012).

Sistema de catalogação

Os dados do Instituto de Estudos Brasileiros é baseado no sistema Dedalus, que é o sistema de catálogo online das bibliotecas da Universidade de São Paulo. O sistema utiliza o modelo MARC (sigla em inglês para catalogação legível por computador), um formato padronizado de ficha catalográfica.

O catálogo do Dedalus fornece o acesso do público ao banco de dados bibliográficos da USP e permite, dentro da biblioteca, a localização das obras e, também, o acesso aos links disponíveis em meio eletrônico. Além disso, o sistema viabiliza os empréstimos e renovações de itens dos acervos das bibliotecas USP para aqueles que tenham vínculo com a universidade.

O entendimento do modelo MARC é importante para esse trabalho, pois os dados, seus campos e suas ferramentas formarão a base da modelagem do banco de dados e também possibilitarão a importação de dados das bibliotecas para o banco de dados desenvolvido.

Manutenção e periodicidade dos dados

Será desenvolvido um banco de dados que será alimentado com os dados das bibliotecas brasilianas. Serão estudadas duas formas em que essa tarefa pode ser feita:

Sistema de recomendação

A partir do banco de dados, será criado um modelo de recomendação de itens para os usuários do repositório, em particular para os pesquisadores que se dedicam ao estudo de assuntos sobre o Brasil. O modelo de recomendação será baseado em características particulares desse tipo de biblioteca, como o fato do acervo ser predominantemente em língua portuguesa.

Os sistemas recomendadores aconselham os usuários sobre produtos ou informações, prevendo o interesse com base em vários tipos de informação.

O modelo de dados em grafos possuem dois tipos de correlação, que geralmente são usados em conjunto:

Cronograma do TCC

Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro
Reunião com a equipe do IEB X X X
Entendimento dos dados X X X
Entendimento do MARC X X X
Estudo do banco de dados em grafos X X X X X
Modelagem do banco de dados X X X
Estudo sobre o desenvolvimento do BD X X X X
Estudo de APIs para carga X X X X
Desenvolvimento do banco de dados X X X X
Criar a aplicação / site X X X X
Estudo sobre o método de recomendação X X X
Implementação do método de recomendação X X X X
Escrever a dissertação X X X X X X
Entregar e apresentar a dissertação

Bibliografia

Antunes(2017)Cristina Antunes.Biblioteca Brasiliana Guita e José Mindlin BBM - USP.

BBM(2020) BBM. Biblioteca Brasiliana Guita e José Mindlin, 2020. URLhttps://www.bbm.usp.br. Acessado em: 29/04/2020.

Huanget al.(2002)Zan Huang, Wingyan Chung, Thian-Huat Ong e Hsin-chun Chen. A graph-based recommender system for digital library.Pro-ceedings of the second ACM/IEEE-CS joint conference on Digital libra-ries - JCDL 02, página 65–73. doi: 10.1145/544220.544231.

IEB(2020)IEB.Instituto de Estudos Brasileiros, 2020.URLhttp://www.ieb.usp.br. Acessado em: 29/04/2020.

Penteado et al.(2014)Raqueline R. M. Penteado, Rebeca Schroeder, Diego Hoss, Jaqueline Nande, Ricardo M. Maeda, Walmir O. Couto eCarmem S. Hara. Um estudo sobre bancos de dados em grafos nativos.X ERBD-Escola Regional de Banco de Dados.

Sarwaret al.(2001)Badrul Sarwar, George Karypis, Joseph Konstan e JohnRiedl. Item based collaborative filtering recommendation algorithms. Proc. 10th International World Wide Web Conference.

Webber(2012)Jim Webber. A programmatic introduction to neo4j. In: Proceedings of the 3rd annual conference on Systems, programming, and applications: software for humanity.