A GS prevê valores genéticos usando milhares de marcadores de DNA (SNPs, polimorfismos de nucleotídeo único) espalhados no genoma. Diferente da seleção assistida por marcadores (MAS, marker-assisted selection), a GS não exige mapear genes específicos antes. Isso torna a técnica adequada para características complexas controladas por muitos genes de pequeno efeito. Na aquicultura, isso significa selecionar mais cedo e com mais precisão, inclusive para traços de baixa herdabilidade.
O artigo lembra o contexto: em 2020, a produção global de pesca e aquicultura somou 214 milhões de toneladas, avaliada em US$ 424 bilhões. Melhoramento genético é um dos motores desse avanço. A GS entra nessa agenda ao calcular valores genéticos genômicos (GEBV, genomic estimated breeding values) a partir da relação genótipo–fenótipo observada numa população de referência. Depois, prevê o desempenho de candidatos à reprodução.
O que há de novo nos modelos
A revisão organiza os modelos de GS em três blocos:
- BLUP (melhor predição linear não viesada) baseados em genoma, como GBLUP e RRBLUP (ridge regression BLUP). Há variantes que integram dados de pedigree e genoma (ssGBLUP, single-step GBLUP), ajustam pesos de marcadores (WGBLUP) e separam efeitos por regiões do genoma (GFBLUP, genomic feature BLUP).
- Bayesianos, como BayesA, BayesB, BayesC/π, BayesR e BayesLASSO, que assumem distribuições diferentes para o efeito dos SNPs.
- Aprendizado de máquina (machine learning), incluindo RF (random forest), XGBoost (eXtreme gradient boosting), SVR (support vector regression), KRR (kernel ridge regression) e redes neurais.
A revisão destaca ainda extensões que modelam G × E (genótipo por ambiente) — via modelos multi-traço ou normas de reação — e que incorporam multiômicas (por exemplo, GTBLUP, que usa similaridade transcriptômica, e GOBLUP, que integra camadas ômicas). Objetivo: aumentar a acurácia e entender melhor a biologia dos traços.
Onde esses modelos já funcionam
A GS já foi testada em cerca de 25 espécies aquícolas, com exemplos em salmão-do-Atlântico, truta-arco-íris, tilápia-do-Nilo, camarão-branco-do-Pacífico, vieiras e ostras, entre outras. As acurácias variam conforme espécie, traço e modelo, com casos em que Bayesianos superam GBLUP (especialmente quando há QTLs, loci de característica quantitativa, de grande efeito) e outros em que GBLUP mantém desempenho similar ou superior para traços mais poligênicos.
Softwares à mão
Para rodar GS, a revisão lista pacotes amplamente usados: BLUPf90, DMU e ASReml para modelos mistos; e soluções em R como BGLR, rrBLUP e sommer. Há também ferramentas específicas (por exemplo, GS3, HiBLUP, MiXBLUP), inclusive opções para Bayesianos e para dados multi-efeitos. Definições técnicas: REML (máxima verossimilhança restrita) estima componentes de variância; MCMC (cadeias de Markov Monte Carlo) amostra distribuições a posteriori em modelos Bayesianos.
Desafios do campo
A aquicultura tem particularidades que exigem desenho cuidadoso dos programas: alta fecundidade e fertilização externa (estruturas familiares complexas), fenotipagem cara ou destrutiva para traços-chave (por exemplo, resistência a doenças) e forte G × E em ambientes aquáticos (temperatura, salinidade, oxigênio, sistemas de cultivo). Tudo isso impacta a coleta de dados, a escolha do modelo e a transferência de predições entre fazendas e regiões. Em aprendizado de máquina, a afinação de hiperparâmetros é crítica para capturar padrões sem overfitting.
Em resumo
A seleção genômica está pronta para dar o próximo salto no melhoramento aquícola. A revisão entrega um “mapa” prático: quais modelos existem, quando usar cada um, quais softwares instalar e quais armadilhas evitar. Para os produtores e programas de melhoramento, a mensagem é direta: com desenho experimental adequado, dados de qualidade e modelo certo, dá para selecionar mais rápido e com mais precisão — traçando um caminho concreto para ganhar eficiência no viveiro.