top of page
image1_0 (1).jpg

Desenvolvimento de um biodefensivo ecológico a partir de RNAi

EMBRAPA Agroenergia

2020 - 2022

Análises de dados genéticos de plantas  para identificar genes letais, visando desenvolver biodefensivos contra ervas daninhas.

Minerei e adaptei dados de diversas fontes e espécies.

Desenvolvi pipelines e códigos em Python, Bash e R para gerenciar, analisar e integrar conjuntos de dados, resultando em um banco de dados de genes potenciais.

CONTEXTO 

Obs.: Este projeto foi realizado em parceria com indústria privada, e devido a um contrato de confidencialidade, não será possível compartilhar detalhes dos códigos desenvolvidos e resultados.

No entanto, apresentarei as informações que estão dentro do que é permitido divulgar, respeitando os acordos de sigilo estabelecidos.

*Off-target:  todas as outras espécies, que não podem ser afetadas pelo produto, como cultivares, humanos e espécies de importância econômica

Cerca de um quarto dos custos de produção agrícola são destinados ao controle de ervas daninhas pragas e doenças. O uso excessivo de agroquímicos tem aumentado esses custos e gerado problemas como resistência, prejuízos  à saúde e impactos ambientais negativos. Para lidar com isso, surge a necessidade de tecnologias mais eficientes e sustentáveis, e a tecnologia do RNA de interferência (RNAi) tem se destacado globalmente por sua alta especificidade e eficiência no controle desses problemas.

 

Este projeto propôs desenvolver um biodefensivo ecológico com  a tecnologia de RNAi pulverizado para o controle de ervas daninhas em culturas como milho e soja.

Como analista de dados biológicos, participei da primeira etapa do projeto, que tinha como principal objetivo identificar potenciais genes das plantas daninhas para serem alvos de silenciamento por RNAi. Um bom candidato deveria atender a diversos critérios, que incluíam similaridades com off-targets*, função gênica e características moleculares de estabilidade. Para avaliar estes fatores, dados foram coletados, integrados e analisados a partir de pipelines desenvolvidas pelo grupo de análise. Por fim, foi entregue um banco de dados contendo os genes selecionados e hierarquizados conforme os critérios determinados.

Workflow da Análise

1

Mineração dos dados da planta alvo e espécies off-target

  • Primeiramente foi realizado o levantamento de conjuntos dados ômicos publicamente disponíveis para as espécies alvo​ e off-target*

    • Bancos de Dados: GenBank (NCBI), EMBL​

  • Os conjuntos de dados encontrados foram submetidos à avaliação da qualidade e integridade. Os que não cumpriam os requisitos mínimos eram descartados

    • Ferramentas: FastQC e HISAT2​

  • Também foi realziada a busca de tecnologias e pipelines de análise de RNAi disponíveis em literatura científica

2

Preprocessing and integration of raw data

  • Após obtidos e curados, os dados foram tratados e processados para que se desse segmento à análise

  • Algumas ferramentas de bioinformática utilizadas para processamento de dados brutos foram:​

    • Montagem de RNAseq: Trinity

    • Anotação: Trinotate

  • Também foram utilizadas as seguintes linguagens de programação e ferramentas para organização e visualização de dados:

    • Python

    • Bash/Shell

    • Excel

3

Search for target gene data

  • Realizamos uma pesquisa na literatura e em bancos de dados para identificar genes de plantas que seriam mais letais ao serem silenciados.

  • Devido à escassez de informações sobre nossas espécies-alvo, utilizamos dados de plantas modelo.

    • Bancos de dados: UNIPROT, BdTAIR, NCBI Genbank​

  • As sequências dos genes letais selecionados foram buscados em meio aos transcriptomas anotados de nossa espécie alvo a partir de ferramentas de alinhamento como BLAST e códigos em Python.

4

Seleção dos genes-alvo utilizando critérios estabelecidos

Eliminação por off-targets
  • As sequências dos genes letais das plantas alvo foram comparados com os transcriptomas dos organismos off-target  a partir de alinhamentos e mapeamentos

    • Ferramentas: BLAST e HiSAT2​

  • Quando um gene da planta alvo apresentava uma similaridade de nucleotídeos com algum off-target, ele era eliminado

Classification based on additional criteria
  • Outras métricas foram utilizadas para que pudéssemos  elaborar uma hierarquia de prioridade para as sequências de gene alvo.

  • Essas métricas foram selecionadas de acordo com informações da literatura, que ressaltavam a importância de determinadas características para o sucesso de um RNAi*

*Detalhes da informação protegidos pelo contrato de confidencialidade

  • Para mensurá-las, utilizamos ferramentas públicas e desenvolvemos códigos em Python para a geração desses dados. Algumas ferramentas públicas utilizadas:

    • iScore Designer: cálculo de estabilidade termodinâmica

    • siRNA design Integrated DNA Technologies: presença de sítio de clivagem para formação de siRNAs

    • BOWTIE e SALMON: quantificação da expressão de transcritos gênicos

    • RNAfold: verificação de estrutura secundária

5

Elaboração de banco de dados

  • Analisamos os transcriptomas das espécies alvo, medimos os parâmetros de todos os transcritos e os inserimos em um banco de dados compartilhado com outros pesquisadores. Isso permitiu que eles visualizassem e selecionassem genes conforme seus critérios prioritários para conduzir análises in vitro

  • Este banco de dados foi disponibilizado aos outros pesquisadores do projeto no site da EMBRAPA de forma privada, levando em conta as diretrizes de confidencialidade estabelecidas no contrato

RESULTADOS

01

Genes Alvo Letais

Foi gerada uma lista de 22 genes alvos considerados letais para a planta, com seus critérios mensturados e o desenho de suas sequências para testes em bancada.

02

Banco de Dados

Foi entregue um banco de dados com mais de 16 mil opções de transcritos contendo todos os critérios mensurados, para consultas futuras dos pesquisadores do projeto.

03

Pipeline de Análise

Disponibilizamos para o cliente o pipeline desenvolvido com todos seus códigos e ferramentas. Desta forma, permitimos que os pesquisadores pudessem utilizar posteriormente para aplicações a outras espécies que não foram analisadas nesta ocasião.

Considerações finais

Este projeto foi conduzido em colaboração com uma empresa privada de tecnologia agrícola, representando uma oportunidade significativa para ampliar meu conhecimento no campo da inovação e no desenvolvimento de novas tecnologias.

Além disso, a experiência proporcionada pelo trabalho remoto foi significativa, permitindo-me desenvolver competências valiosas, como autonomia na gestão do tempo, habilidades de comunicação virtual e capacidade de solucionar problemas de forma independente, as quais são distintivas em relação ao ambiente de trabalho presencial.

bottom of page