Navigation Bar

Health from Portugal (HfPT)

A presente aplicação faz parte de um projeto de dissertação que está, por sua vez, inserido num projeto de grande escala denominado Health from Portugal (HfPT), do qual o Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência (INESC TEC) é parte ativa. O HfPT 'visa posicionar Portugal como um hub de referência mundial na conceção, desenvolvimento e produção de soluções avançadas dirigidas aos mercados da saúde, assentes na inovação e tecnologia.' O papel do INESC TEC dentro do HfPT passa por participar em 'atividades que vão desde o diagnóstico, tratamento e monitorização de doenças; planeamento cirúrgico; estruturação e armazenamento de dados e gestão logística; levando a resultados como sensores, algoritmos de inteligência artificial, sistemas de informação, soluções de robótica móvel e suporte na avaliação de tecnologias em saúde.'

Fonte das citações: Agenda HfPT

Para mais informações sobre o HfPT e o papel do INESC TEC, consulte a página do INESC TEC sobre o projeto.

Sobre este projeto

Esta aplicação está inserida num projeto de dissertação do Mestrado em Engenharia Informática e Computação denominado 'Generating Synthetic Clinical Data in European Portuguese Using an Open-Source Large Language Model', que pode ser traduzido como 'Gerando Dados Clínicos Sintéticos em Português Europeu com Recurso a um Modelo de Linguagem de Grande Escala de Código Aberto'.

O recente desenvolvimento acentuado dos modelos de Inteligência Artificial (IA) tem o potencial de trazer numerosos benefícios clínicos. Estes modelos podem ser usados para apoio no diagnóstico e decisão, no planeamento de tratamentos, na escolha de pacientes para ensaios clínicos, entre muitas outras aplicações.

No entanto, os modelos recentes, mais capazes, necessitam de quantidades imensas de dados clínicas para se tornarem capazes de realizar estas funções. O problema reside no facto de que dados clínicos contêm informação sensível e a sua publicação para uso em investigação requer a remoção especializada de elementos sensíveis e identificativos. Como tal, muitos idiomas, incluindo português europeu, sofrem de grande falta de dados clínicos publicamente disponíveis e, como tal, não conseguem tirar partido do desenvolvimento da IA.

Uma possível solução para amenizar este problema é a utilização de modelos de IA para gerar grandes quantidades de dados clínicos sintéticos que procurem replicar as características de dados clínicos reais, com objetivo de tornar os dados sintéticos abertos ao público, para que possam ser utilizados em qualquer projeto ou investigação que deles necessite, incluindo o desenvolvimento de modelos clínicos de IA. A geração de dados clínicos sintéticos em português europeu é o objetivo deste projeto de dissertação. Para que os dados gerados possam ser utilizados futuramente, é necessário avaliar a sua habilidade de simular dados reais. Um dos métodos mais fiéis de o fazer é através da opinião especializada, que é o objetivo desta aplicação. Se os dados sintéticos forem capazes de passar por reais aos olhos de especialistas, esse facto constitui um ótimo sinal do seu potencial para utilização em projetos futuros, como substitutos de dados reais.

Footer