A Figura 2 ilustra o processo de transferência de tecnologia atual que deve ser familiar para nós do setor de ciências da vida. Do lado esquerdo estão todos os sistemas que contribuem para a definição do produto, da embalagem e do processo. Tudo isso precisa ser passado por meio de um firewall e recebido por um grupo interno de fabricação ou por vários fabricantes contratados que precisam interpretar suas informações relevantes.
Nossa missão é permitir a conversão desses documentos “paper on glass” ou baseados em imagens em algo estruturado e repetível que possamos fornecer de forma consistente aos sistemas seguintes e remover o elemento humano de interpretar a intenção desse documento. Em seguida, os dados podem ser aproveitados por todos os próximos parceiros.
Como fazemos
Olhando para o processo para cumprir essa missão, primeiro precisamos garantir que os dados sejam enviados com segurança. Muitas empresas se comunicam via FTP, e-mail, telefonemas e sites, e torna-se muito difícil, do ponto de vista da estratégia de controle, proteger a propriedade intelectual (IP). No final das contas, tudo o que flui através da transferência de tecnologia é a propriedade intelectual da sua empresa que deve ser protegida e disponibilizada para as partes certas no momento certo.
Não se trata apenas da conversão dos dados; trata-se também de rastrear esses dados. Você precisa de um histórico de auditoria no caso de um evento adverso para poder entender exatamente o que foi convertido, quem aprovou, quem assinou, quem recebeu os dados e quem consumiu os dados.
Alguém é responsável por coletar todas as informações de todos os diferentes sistemas usados pelos cientistas e engenheiros de desenvolvimento de processos. Em seguida, eles precisam agregá-los em um único documento ou talvez um compêndio de documentos e organizar o processo de entrega dos dados à sua organização de fabricação.
O que está faltando é aquele mecanismo de organização e conversão como o Google Tradutor, que entende a verdadeira intenção do que você está tentando comunicar por meio da transferência de tecnologia e o transforma em algo previsível e aproveitável.
A ideia é que, uma vez que os dados sejam analisados em um formato compreensível e reutilizável, os sistemas seguintes não exigirão que humanos digitem todas as informações. Em vez disso, as informações são enviadas automaticamente para o sistema que precisa delas.
Nossa intenção é usar um mecanismo de processamento de linguagem natural que entenda os documentos - o contexto das palavras, a semântica, a intenção gramatical - e tenha um algoritmo de aprendizado de máquina que possa entender a intenção de cada documento e convertê-lo em um formato estruturado ISA 88. Essencialmente, ele pega os documentos e os une com dados digitais para criar uma construção de dados digitais reutilizáveis que seus sistemas possam absorver prontamente.
Mas os documentos de transferência de tecnologia não têm apenas dados digitais ou textuais formatados em tabelas ou hierarquias. Eles também têm dados de imagem. Pode haver análise cromatográfica. Pode haver métodos de amostragem e métodos de teste. Esses são conjuntos de dados não estruturados que você não pode converter facilmente em dados digitais. Mas eles estão relacionados a algum nível de dados digitais, portanto você precisa entender as diferenças inerentes em diferentes conjuntos de dados que podem estar ocultos nesse documento.
Quando você executa o documento por meio da ferramenta de processamento de linguagem natural, ele pode obter imagens digitalizadas e usar tecnologias de reconhecimento óptico de caracteres (OCR) para extrair dados. Ou, se acontecer de ter se originado como dados digitais que foram capturados em um documento PDF, ele pode extrair os dados novamente.
Neste ponto, não há contexto por trás desses dados. A ferramenta simplesmente extraiu os dados e disse: “Eu entendo o volume de dados que existe neste documento”. A saída do processamento de linguagem natural procura indicadores-chave para que possamos criar conjuntos de dados tabelados que possam ser facilmente importados ou absorvidos pelo próximo sistema.
Um dos benefícios dessa abordagem é a colaboração que ela possibilita. É muito difícil colaborar com alguém em um documento PDF se um valor for mal interpretado. Como você transmite isso? Você envia um e-mail e diz: “Ei, tem um valor que não consigo ler na linha quatro da página 22, parágrafo três”. Se você conseguir extrair isso, a camada de inteligência pode dizer o que está faltando ou é capaz de destacar as partes que você deve prestar atenção para tornar o processo muito mais eficiente.
Escolha um caminho
Existem duas direções a tomar. Uma é continuar fazendo o que está fazendo hoje porque você entende isso. Na indústria de ciências da vida, é muito difícil promover mudanças. Assim, você pode continuar trabalhando com organizações de desenvolvimento e fazer com que produzam os mesmos PDFs que produziram há anos e, em seguida, use uma camada de processamento de linguagem natural para convertê-lo em algo digital, reutilizável e legível. Esse é um caminho.
O segundo caminho é adotar ferramentas digitais nativas que permitem modelar o processo e os materiais precocemente no processo de desenvolvimento e publicar de forma nativa os conjuntos de dados digitais. Somos realistas, pois sabemos que levará anos - se não décadas - para que certas áreas do setor de ciências da vida adotem soluções digitais nativas.
Nesse meio tempo, estamos promovendo essa abordagem de dois caminhos: comece usando o poder de computação da IA e do aprendizado de máquina para converter documentos em algo reutilizável e, com o tempo, adote ferramentas digitais nativas. O maior benefício é simplesmente maior eficiência da mão de obra, mas vai além disso:
- Maior velocidade para ensaios clínicos, mercado e autorizações de mercado (variações ou sabores)
- Redução do custo geral de transferências internas e externas para fabricação
- Maior velocidade e eficiência da validação do processo
- Redução do intervalo de Aprovisionamento/inicialização de instalações, linhas e equipamentos
- Melhor qualidade de lote e redução de refugo e desperdício
- Maior velocidade no envio e aprovação regulatória
- Melhor qualidade do circuito fechado inerente ao projeto, desde o desenvolvimento, passando pela fabricação até a regulamentação
- Melhor rastreabilidade na genealogia do lote (país certo, produto certo)