1,721,173 research outputs found

    Predição de sementes haploides de milho usando aprendizado profundo e utilização de genomas mock para a predição genômica de híbridos

    No full text
    Prediction is a key concept for animal and plant breeding. Accurate estimates of phenotypic and genetic values are crucial for the selection of the best genotypes. For this reason, several tools have been used to improve the accuracy of these estimates, from molecular markers, used to access genetic information, to high-throughput phenotyping, used to increase sample size and phenotypic precision. Here, we present two studies involving the use of different approaches and tools in the prediction process. First, we describe a study using deep learning and images for seed phenotyping. We built a convolutional neural network (CNN) model to classify images from putative and true haploid maize seeds based on the R1-nj phenotype. Our results reveal that the CNN model could classify putative haploid maize seeds with high accuracy (97%). However, the CNN model was unable to recognize true haploid seeds. Finally, we provide a highly accurate and trained CNN model to the scientific community to classify haploid maize seeds via R1-nj. In the latter, we studied using mock genomes to discover markers and their effect on estimates of genetic diversity and genomic prediction of hybrids. Moreover, we compared them with SNP markers from SNP-array and genotyping-by-sequencing (GBS) scored in the reference genome B73. Our results show that using mock genomes delivers estimates comparable to standard platforms when considering simple traits and additive effects. However, for complex traits and dominance effects, the estimates were slightly worse. We believe that these studies provide relevant knowledge for the phenotypic and genomic prediction applied to plant breeding.A predição é um conceito chave para o melhoramento animal e de plantas. Estimativas acuradas dos valores fenotípicos e genéticos são fundamentais para a seleção dos melhores genótipos. Por isso, diversas ferramentas vêm sendo empregadas com o objetivo de melhorar a precisão dessas estimativas, desde marcadores moleculares, usados para acessar a informação genética, até a fenotipagem de alto rendimento, usada para aumentar o tamanho da amostra e a precisão fenotípica. Nesse trabalho, nós apresentamos dois estudos envolvendo o uso de diferentes abordagens e ferramentas no processo de predição. No primeiro capítulo, nós apresentamos um estudo envolvendo o uso de deep learning e imagens para a fenotipagem de sementes. Nele, nós construímos um modelo de rede neural convolucional (CNN) para classificar imagens de sementes haploides putativas e verdadeiras de milho baseadas no fenótipo R1-nj. Nossos resultados mostram que o modelo CNN foi capaz de classificar as sementes putativas com elevada acurácia (97%). No entanto, o modelo não conseguiu detectar as sementes haploides verdadeiras. Por fim, nós disponibilizamos à comunidade científica um modelo CNN treinado e com alta acurácia para classificar sementes haploides de milho. No último capítulo, nós estudamos a utilização de genomas mock para a descoberta de marcadores e o seu efeito sobre estimativas de diversidade genética e predição genômica de híbridos. Além disso, nós os comparamos com marcadores SNP oriundos de um SNP-array e genotyping-by-sequencing (GBS) ancorado no genoma de referência B73. Nossos resultados mostram que a utilização de genomas mock entrega estimativas comparáveis às plataformas padrão, quando consideramos caracteres simples e efeitos aditivos. No entanto, para caracteres complexos e para os efeitos de dominância as estimativas foram um pouco piores. Nós acreditamos que esses trabalhos adicionam conhecimento relevante para a predição fenotípica e genômica aplicado ao melhoramento vegetal

    Predição genômica para populações segregantes de soja: estratégias de seleção e estabelecimento da população de treinamento

    No full text
    New soybean cultivars are generated from bi-parental crosses, followed by selection and homozygosis increasement stages, which the order of number of generations can vary according to the breeding method adopted. In the initial steps, the low quantities of seeds per progeny and the large number of individuals to be tested, makes it impossible to obtain a high-quality evaluation on field. In this context, genomic selection comes as an alternative predictive method, instead of simple random sampling. Therefore, the objective of this research is to explore relevant aspects related to the application of genomic prediction in the initial stages of a soybean breeding program. The results show good prediction ability (above 0.4) for traits tested evaluated (yield, plant height and maturity), showing that it is possible to apply genomic selection already in F2 and obtain selection gains. In addition, it has been shown that it is possible to obtain predictive abilities equivalent to a full-sibs training set, establishing it only with advanced progenies of the breeding program, allowing the generation high predictive training populations without prior evaluation of within-family progenies, which allows the creation of stable training sets over the years and applicable in different families.Novas cultivares de soja são geradas a partir de cruzamentos bi-parentais, seguido de etapas de seleção e avanço de homozigose, cuja ordem de número de gerações varia de acordo com o método de melhoramento adotado. Nas etapas iniciais, a pouca quantidade de sementes por progênie, além da grande quantidade de indivíduos inviabiliza testes à campo com boa acurácia seletiva. Nesse contexto, a seleção genômica vem como método preditivo alternativo à simples amostragem aleatória nessas etapas. Sendo assim, o objetivo desta pesquisa for explorar aspectos relevantes ligados à aplicação de predição genômica nas etapas iniciais de um programa de melhoramento de soja. Os resultados mostram boa capacidade preditiva (acima 0.4) para os caracteres estudados (produtividade, altura de plantas e maturidade), mostrando ser possível aplicar seleção genômica já em F2 e obter ganhos de seleção. Além disso, demostrou-se que é possível obter capacidades preditivas equivalentes a um set de treinamento com irmãos completos, compondo-o apenas com linhagens avançadas no programa de melhoramento, possibilitando a criação de populações de treinamento performantes sem a necessidade de avaliação previa de progênies da mesma família, o que possibilita a criação de sets de treinamento estáveis ao longo ao longo dos anos e aplicáveis em distintas famílias

    Do pixel a informação: como fenotipagem de alto rendimento pode avaliar a arquitetura genética e melhor a capacidade preditiva em milho sob inoculação de bactérias promotoras de crescimento de plantas?

    No full text
    Plant growth-promoting bacteria (PGPB) may play an important role in the agriculture in the future due to the ability of these bacteria in promote growth without causing any type of environmental damage. Besides, they can increase the plant resilience against biotic and abiotic stress and improve nutrient uptake. Nevertheless, only a few works have studied the genetic architecture of the response to PGPB. Another emerging field is the high-throughput phenotyping (HTP) which can be used to improve the assessment of the new phenotypes and be integrated in genetics studies. Based on this, we study the genetic architect of the response to PGPB using a public tropical association panel containing 360 inbreeds lines genotyped using genotype-by-sequence methodology with 13,826 single-nucleotide polymorphisms using RGB, multi, and hyperspectral cameras, besides the traditional phenotypes. Also, we develop a low-cost HTP platform for greenhouses experiments. In addition, several single-trait, multi-trait, machine learning models and its application in the context of genetics studies is discussed. Collectively, our results reveal the usefulness of PGPB in increase plant resilience and the applications of HTP phenotypes in genetics studies to dissect the genetic architecture and improve the accuracy in predictive models.Bactérias promotoras de crescimento de plantas (BPCP) podem ter um papel crucial no futuro da agricultura devido a sua capacidade de promover o crescimento de plantas, sem causar nenhum tipo de dano ambiental. Além disso, BPCP possuem a capacidade de aumentar a resiliência do seu hospedeiro contra estresses bióticos e abióticos, além de promover o aumento da absorção de nutrientes. No entanto, poucos trabalhos estudaram a arquitetura genética da resposta ao BPCP. Outro campo emergente é a fenotipagem de alto rendimento (FAR) que pode ser usada para melhorar a avaliação dos novos fenótipos e ser integrada em estudos de arquitetura genética. Com base nisso, estudamos a arquitetura genética da resposta as BPCP usando um painel público de associação de milho tropical contendo 360 linhagens genotipadas usando a metodologia genotype-by-sequence com um total de 13.826 polimorfismos de nucleotídeo único (SNPs). Para as avaliações foram utilizadas câmeras RGB, multi e hiperespectral, além dos fenótipos tradicionais. Além disso, desenvolvemos uma plataforma de FAR de baixo custo para experimentos em casa de vegetações. No trabalho são discutidos vários modelos single, multi-trait e de aprendizado de máquina, e suas aplicações no contexto de estudos genéticos. Coletivamente, nossos resultados revelam a utilidade do BPCP no aumento da resiliência das plantas e as aplicações dos fenótipos FAR em estudos genéticos para dissecar a arquitetura genética e melhorar a acurácia em modelos preditivos

    Otimizando programas de melhoramento com o uso de ferramentas modernas: estudos de caso em arroz e framboesa

    No full text
    Agriculture currently faces several challenges associated with the imbalance between population growth and food production, as well as climate change. To overcome these challenges, breeding must utilize all necessary technologies to develop crops with higher productivity, resistance, stability, and climate-smart traits. The breeding process is generally evaluated regarding selection gain, which depends on several parameters in the breeders equation that have significantly changed in recent years. These changes have been enabled by advances in different omics such as phenomics, enviromics, and genomics. In this way, we applied some of the most recent breeding tools to contribute to agriculture in two case studies. In the second chapter, we simultaneously used association mapping and graphical networks to identify genomic regions responsible for resistance to one of the most significant fungi affecting raspberries. We used parents from more than one species, differing in economic importance and resistance, and employed both classical phenotyping techniques and highthroughput phenotyping to characterize this interspecific population. In the final chapter, we demonstrated an efficient way to optimize Multi-Environment Trials using enviromics. Additionally, we evaluated the environmental covariates that most influence rice yield in the US Rice Belt and characterized these Target Population of Environments (TPEs). Despite the US rice production representing 5% of the worlds rice production and having tripled its imports since 2001, there is still a need for work characterizing its TPEs. Thus, this work presents itself as a valuable resource for modern breeding, contributing to the production of more resistant, productive, and climate-smart varieties to address the current breeding challenges.A agricultura atualmente enfrenta vários desafios associados ao desequilíbrio entre o crescimento populacional e a produção de alimentos, além das mudanças climáticas. Para superar esses desafios, o melhoramento deve utilizar todas as tecnologias necessárias para desenvolver variedades com maior produtividade, resistência, estabilidade e caracteres otimizados ambientalmente. O processo de melhoramento é geralmente avaliado em relação ao ganho de seleção, que depende de vários parâmetros na equação do melhorista, os quais mudaram significativamente nos últimos anos. Essas mudanças foram possibilitadas pelo avanço de diferentes ômicas, como fenômica, envirômica e genômica. Dessa forma, aplicamos algumas das ferramentas mais recentes do melhoramento com o objetivo de contribuir com a agricultura em dois estudos de caso. No segundo capítulo, utilizamos simultaneamente mapeamento associativo e redes gráficas para identificar regiões genômicas responsáveis pela resistência a um dos fungos que mais afetam as framboesas. Usamos parentais de mais de uma espécie, diferenciando-se em importância econômica e resistência, e empregamos tanto técnicas clássicas de fenotipagem quanto fenotipagem de alto-rendimento para caracterizar essa população interespecífica. No último capítulo, demonstramos uma maneira eficiente de otimizar ensaios multi-ambientes utilizando envirômica. Além disso, avaliamos as covariáveis ambientais que mais influenciam a produtividade do arroz no cinturão de arroz dos EUA e caracterizamos suas Populações Alvo de Ambientes (TPEs). Apesar da produção de arroz dos EUA representar 5% da produção mundial de arroz e ter triplicado suas importações desde 2001, ainda é necessário realizar trabalhos que caracterizem suas TPEs. Assim, este trabalho se apresenta como um recurso valioso para o melhoramento genético moderno, além de contribuir para a produção de variedades mais resistentes, produtivas e adaptadas a diferentes ambientes alvo, enfrentando os desafios atuais do melhoramento

    Accuracy of simultaneous selection for interest traits in second growing season tropical maize

    No full text
    O milho de segunda safra, também conhecido como milho safrinha, é definido como aquele semeado entre os meses de janeiro e março. Esta modalidade de cultivo atingiu no ano agrícola de 2013/2014 uma área plantada de 9,18 milhões de hectares, superior a área cultivada com milho primeira safra, que no mesmo período foi de 6,61 milhões de hectares. Na segunda safra, há alto risco de instabilidades climáticas, principalmente em decorrência de baixas temperaturas, geadas, má distribuição de chuvas e redução do fotoperíodo. Todos estes fatores prejudicam a atividade fotossintética do milho, reduzindo sua produtividade. No entanto, dada a importância deste cultivo, empresas públicas, privadas e universidades vêm buscando incrementar a produtividade e a estabilidade. Para isso, alguns caracteres são especialmente preconizados. Devido ao alto risco de perda por adversidades ambientais, muitos produtores investem pouco em adubação, principalmente adubação nitrogenada. Neste contexto, o desenvolvimento de plantas mais eficientes no uso e, ou, tolerantes ao estresse por nitrogênio, resultaria em maior segurança para o produtor. Não obstante, a precocidade tem elevada importância, já que materiais precoces reduzem o risco de perdas neste período. No entanto, a mesma deve estar sempre associada a alta produtividade. Assim, para a seleção simultânea destes caracteres, pode-se lançar mão de índices per se de resposta das plantas ao estresse, análises gráficas e, ou, índices de seleção simultânea. Adicionalmente, os valores genotípicos das linhagens para essas características, além de serem preditos via REML/BLUP single-trait (análise univariada), também podem ser preditos via REML/BLUP multi-trait (análise multivariada). Dessa forma, os valores genotípicos são corrigidos pela covariância existente entre os caracteres. Assim, o objetivo deste trabalho foi verificar a possibilidade de seleção simultânea para eficiência no uso e tolerância ao estresse por nitrogênio, além de plantas precoces e produtivas. Para isto, linhagens de milho tropical foram cultivadas e avaliadas para estes caracteres. Foram então simulados diversos cenários de seleção simultânea. A partir destes resultados, observou-se que o índice per se de resposta das plantas ao estresse Média Harmônica da Performance Relativa (MHPR) foi o mais eficiente na seleção de plantas eficientes no uso e tolerantes ao estresse por nitrogênio. Isto ocorreu devido a forte correlação desfavorável entre os índices que estimam a eficiência e a tolerância, além da superioridade e em acurácia, herdabilidade e ganhos com a seleção deste índice per se. Já para a seleção simultânea da produtividade e precocidade, o índice Aditivo de seleção simultânea, utilizando os valores genotípicos preditos via REML/BLUP single-trait se mostrou o mais eficiente, já que obteve ganhos satisfatórios em todos os caracteres e há a possibilidade de modular, de forma mais satisfatória, os ganhos em cada caractere. Conclui-se que a seleção simultânea tanto para eficiência no uso e tolerância ao estresse por nitrogênio, quanto para produtividade e precocidade são possíveis. Além disso, a escolha do melhor método de seleção simultânea depende da magnitude e do sentido da correlação entre os caracteres.Second growing season maize, also known as winter maize, is the maize sowed in Brazil between January and March. This growing modality reached 9.18 million hectares in 2013/2014, higher than the area cultivated in first growing season that was 6.61 million hectares in the same period. In the second season, there is a high risk of climate instabilities, mainly due to low temperatures, frost, poor rainfall distribution and reduction of photoperiod. All these factors harm photosynthetic activity, reducing the maize yield. However, because of the recent plant area increasing, public, private companies and universities have sought increased yield and stability of the second growing season maize. For this, some traits are mainly in the selection process. With the high risk of yield loses due to environmental adversities, many farmers have done little investment in fertilizers, especially nitrogen fertilization. In this context, the development of plants that are nitrogen use efficient and nitrogen stress tolerant could result in a safer activity for the farmers. In addition, the earliness is highly important, since early materials reduce the risk of losses during this period. However, the earliness must always be associated with a high yield. This way, simultaneous selection of these traits can be made by per se responses indexes of stressed plants, graphical analysis and simultaneous selection indexes. Additionally, the genotypic values of the genotypes for the traits can be predicted not only by REML/BLUP single-trait (univariate analysis), but also by REML/BLUP multi-trait (multivariate analysis). In the second, the genotypic values are adjusted considering the covariance between the traits. This way, the objective of this study was to investigate the possibility of simultaneous selection for nitrogen use efficiency and nitrogen stress tolerance, as well as early and high yielding plants. For this, tropical maize lines were grown and evaluate. By these data, it was simulated several simultaneous selection sets. It was observed that Harmonic Mean of the Relative Performance (HMRP) is the most efficient in the selection for nitrogen use efficient and nitrogen stress tolerance. This probably occurs due to the strong unfavorable correlation between the indexes that estimate the efficiency and the tolerance, as well as the superiority in accuracy, heritability and selections gains of HMRP. In case of simultaneous selection for yield and earliness, the additive simultaneous selection index using the genotypic values predicted by REML/BLUP single-trait proved the most efficient selection, because it got satisfactory gains in all the traits and, this index allows the possibility to modulate the gains in each trait. It was concluded that the simultaneous selection for nitrogen use efficiency and nitrogen stress tolerance, as well as for yield and earliness are possible. Furthermore, the choice of the best simultaneous selection method depends on the magnitude and direction of the correlation between the traits

    Kernels com base ambiental otimizam a alocação de recursos com predição genômica multi-características e multi-ambientes para milho tropical

    No full text
    Genomic prediction (GP) success is directly dependent on establishing a training population. Incorporating high-quality envirotyping data increases the efficiency of GP models, especially for multi-environment trials, and provides a better explanation of variation sources. Thus, it can help on multi-trait multi-environment trials (MTMET) by improving predictive ability (PA), selecting information more assertively, and capturing relationships between environments and genotypes. Therefore, in this study, we aimed to design optimized training sets for MTMET. The phenotypic labor is diminished due to lower but optimally selected population sizes while keeping the predictive ability at satisfactory levels. For that, we evaluated the predictive ability of five GP models using the Genomic Best linear unbiased predictor model (GBLUP) with additive + dominance effects (M1) as the gold standard and then adding genotype by environment interaction (G × E) (M2), enviromic data (W) (M3), W+G × E (M4), and finally W+G × W (M5), where G × W denotes the genotype by enviromic interaction. Moreover, we considered single-trait multi-environment trials (STMET) and MTMET, for three traits: grain yield (GY), plant height (PH), and ear height (EH), with two datasets and two cross-validation schemes. Afterward, we built two kernels for genotype by environment by trait interaction (GET) and genotype by enviromic by trait interaction (GWT) to apply genetic algorithms to select genotype:environment:trait combinations that represent 98% of the variation of the whole dataset and composed the optimized training set (OTS). Then, we performed GP and accessed its PA and genetic gain per amount invested. Subsequently, we compared benchmarks with OTS regarding the PA and genetic improvement per unit invested. Considering the best scenario for OTS, which included the GWT kernel, there was a reduction of up to 60% in terms of PA. On the other hand, it was possible to reduce the number of plot:traits to be phenotyped up to 98%. Furthermore, using OTS based on enviromic data, it was possible to increase the response to selection per amount invested by 142%. Consequently, our results suggested that genetic algorithms of optimization associated with genomic and enviromic data are efficient in designing optimized training sets for genomic prediction and improve the genetic gains per dollar invested. Although, it is worth remembering that exist specific interactions within datasets that should not be ignored when using the proposed approach.O sucesso da predição genômica (GP) é diretamente dependente do estabelecimento de uma população de treinamento. A incorporação de dados de caracterização ambiental de alta qualidade aumenta a eficiência dos modelos GP, especialmente para ensaios em múltiplos ambientes, e fornece uma melhor explicação de fontes de variação. Assim, a caracterização ambiental pode ajudar em ensaios multi-características e multi-ambientais (MTMET), melhorando a capacidade preditiva (PA), selecionando informações de forma mais assertiva e capturando relações entre ambientes e genótipos. Portanto, neste estudo, objetivamos formar populações de treinamento otimizadas para MTMET. O trabalho de fenotipagem é diminuído devido a tamanhos populacionais menores, mas com indivíduos selecionados de forma otimizada, mantendo a capacidade preditiva em níveis satisfatórios. Para isso, avaliamos a capacidade preditiva de cinco modelos de GP usando o modelo GBLUP com efeitos aditivos e de dominância (M1) como padrão e, em seguida, adicionando interação genótipo por ambiente (G × E) (M2) , dados ambientais (W) (M3), W + G × E (M4) e, finalmente, W + G × W (M5), onde G × W denota a interação entre o genótipo e dados ambientais. Além disso, consideramos ensaios multi-ambientais de característica única (STMET) e MTMET, para três características: produtividade de grãos (GY), altura da planta (PH) e altura da espiga (EH), com dois conjuntos de dados e dois esquemas de validação cruzada. Posteriormente, construímos dois kernels para a interação de genótipo por ambiente por característica (GET) e interação de genótipo por dados ambientais por característica (GWT) para aplicar algoritmos genéticos e selecionar combinações de genótipo: ambiente: característica que representam 98% da variação existente no conjunto de dados e então formar a população de treinamento otimizada (OTS). Em seguida, realizamos GP e avaliamos sua PA e ganho genético por valor investido. Posteriormente, comparamos o cenário padrão (MTMET CV2) com as OTS em relação à PA e ganho genético por valor investido. Considerando o melhor cenário para OTS, que incluí o kernel GWT, houve uma redução de até 60% em termos de PA. Por outro lado, foi possível reduzir o número de parcelas: características a serem fenotipadas em até 98%. Além disso, utilizando OTS com base em dados ambientais, foi possível aumentar a resposta à seleção por valor investido em 142%. Dessa forma, nossos resultados sugerem que algoritmos genéticos de otimização associados a dados genômicos e ambientais são eficientes em formar populações de treinamento otimizadas para predição genômica e melhorar as respostas à seleção por dólar investido. Porém, é importante lembrar que existem interações específicas dentro dos conjuntos de dados que não devem ser ignoradas ao utilizar a abordagem proposta

    Influência da modelagem multi-trait, dominância, e estruturação populacional na predição genômica em híbridos de milho

    No full text
    Genomic prediction of single-crosses is a promising tool in maize breeding, increasing genetics gains and reducing selection time. A strategy that can increase accuracy is applying multiple-trait genomic prediction using selection indices, which take into account the performance under optimal and stress conditions. Moreover, factors such as dominance, structural variants, and population structure can influence the accuracy of estimates of genomic breeding values (GEBV). Therefore, the objectives were to apply genomic prediction (i) including multi-trait models, (ii) incorporating dominance deviation and copy number variation effects, and (iii) controlling population structure in maize hybrids. Hence, we used two maize datasets (HELIX and USP), consisting of 452 and 906 maize single-crosses. The traits evaluated were grain yield, plant and ear height, stay green, and four selection indices. From multi-trait GBLUP and GK, using the combination of selection indices in MTGP is a viable alternative, increasing the selective accuracy. Furthermore, our results suggest that the best approach is predicting hybrids including dominance deviation, mainly for complex traits. We also observed including copy number variation effects seems to be suitable, due to the increase of prediction accuracies and reduction of model bias. On the other hand, adding four different sets of population structure as fixed covariates to GBLUP did not improve the prediction accuracy for grain yield and plant height. However, using nonmetric multidimensional scaling dimensions and fineSTRUCTURE group clustering increased reliability of the GEBV for GY and PH, respectively.Predição genômica de híbridos simples é uma promissora ferramenta no melhoramento de milho, pois permite aumentar os ganhos genéticos por unidade de tempo, principalmente por reduzir o tempo de seleção. Uma estratégia que pode aumentar a acurácia das predições genômicas é realizar esta para múltiplos caracteres considerando os mesmos simultâneamente, ou utilizar índices de seleção, os quais captam a performance dos genótipos tanto em condições ótimas como em condições de estresse. Além disso, fatores como dominância, variantes estruturais, e estruturação populacional podem influenciar a acurácia de estimativas dos valores genéticos genômicos (VGG). Portanto, os objetivos foram aplicar predição genômica em híbridos de milho (i) incluindo modelos multi-trait, (ii) incorporando desvios de dominância e efeitos da variação no número de cópias, e (iii) controlando a estruturação populacional. Para isto, dois conjuntos de milho (HELIX e USP) foram utilizados, consistindo de 452 e 906 híbridos simples. Os caracteres avaliados foram produtividade de grãos, altura de planta e espiga, senescência, e quatro índices de seleção. A partir das análises multi-trait dos modelos GBLUP e GK, pôde-se concluir que a combinação dos índices é uma alternativa viável, aumentando a acurácia seletiva. Além disso, os resultados sugerem que o melhor método é a predição de híbridos incluindo desvios de dominância, principalmente para caracteres complexos. Observou-se também que incluir efeitos relacionados a variação no número de cópias indica ser adequado, devido ao aumento da acurácia e redução do viés nos modelos de predição genômica. Por outro lado, a acurácia de predição não aumentou quando se adicionou quatro diferentes conjuntos de estruturação como covariáveis fixas no modelo GBLUP. No entanto, usando o escalonamento multidimensional não métrico e o agrupamento do fineSTRUCTURE aumentaram a confiabilidade de estimação do VGG para produtividade de grãos e altura de plantas, respectivamente

    Análise genômica de um painel de diversidade de milho tropical: um estudo sobre caracterização molecular e resistência ao complexo do enfezamento do milho

    No full text
    The tropical maize is an important pool of genetic diversity to be explored in breeding programs to face new agricultural challenges, nevertheless it requires genetic characterization. For instance, the corn stunt disease complex (corn stunt disease and maize bushy stunt disease) caused significative losses in the last crop seasons, but its genetic control and resistant germplasm are poorly comprehended. In this study, we assembled and genetically characterized a tropical maize diversity panel in order to construct a representative pool of tropical germoplasm for genetic studies and to investigate the genes associated with the resistance of corn stunt disease complex, as well as the potential sources of resistance. For that, 360 inbred lines highly diverse were genotyped using a genotyping-by-sequencing approach with restriction enzymes PstI and MseI and aligned to the version 5 of the B73 reference genome. For genetic assessments, two datasets were considered: one with the raw data, and the second one with data imputed and filtered for quality control, retaining only biallelic markers with minor allelic frequency higher than 0.05, call rate higher than 0.95, and linkage disequilibrium (r2) lower than 0.99. Genome wide association study (GWAS) was performed incorporating the genomic relationship matrix and 3 main principal components to deal with panel structure. Using the filtered dataset, we analyzed the traits proportion of survivor plants (PSP), sanity score in survivor plants (SSSP), and whole sanity score (WSS) which were evaluated in two sites in the State of São Paulo, Brazil. The raw dataset contained 196,803 SNPs well distributed across the chromosomes. The proportion of missing data was 0.391 and the average observed heterozygosity was 0.036. The filtered dataset, containing 14,655 SNPs, showed similar estimates of populational genetic parameters compared to the first one. The structure analysis indicated that this panel comprises nine subpopulations. Through GWAS, 13 markers were significant to the traits and presented functions mainly related to cellulose metabolism, auxin pathway, genes of defense and response to phagocyte oxidase activity, and anthocyanin production. The candidate genes were associated, for example, with the response of glucose accumulation in leaves, the reduction of auxin content, and the direct defense-attack against the pathogens. For each of the traits, we found lines with the totality of favorable alleles in homozygosis, which would facilitate transfering resistance genes to other genotypes. Additionally, the lines from the ancestral PF-41X05-33-05B exhibited high content of favorable alleles to all the traits simultaneously. Our findings reveal underlying genetic mechanisms triggered by plants in response to the corn stunt disease complex and allowed the identification of potential resistant inbred lines. These results can substantially improve the genetic gains when incorporated in breeding programs and constitute an important contribution to the genetic comprehension of the tropical maize germplasm.O milho tropical é uma importante fonte de diversidade genética a ser explorada por programas de melhoramento para lidar com novos desafios agrícolas, mas isto demanda caracterização genética. Por exemplo, o complexo do enfezamento do milho (enfezamento pálido e enfezamento vermelho) tem causado perdas significativas de produtividade nas últimas safras, contudo o controle genético e o germoplasma resistente para estas doenças são pouco compreendidos. Neste trabalho, um painel de diversidade de milho tropical foi construído e caracterizado geneticamente visando delinear um pool representativo de germoplasma tropical para estudos genéticos e investigar os genes associados à resistência do complexo do enfezamento do milho, assim como as potenciais fontes de resistência. Para isso, 360 linhagens altamente diversas geneticamente foram genotipadas usando a abordagem de genotipagem por sequenciamento com as enzimas de restrição PstI e MseI e alinhadas com a versão 5 do genoma de referência B73. Para as avaliações genéticas, foram considerados dois conjuntos de dados: um com dados brutos e o segundo com dados imputados e filtrados para controle de qualidade, mantendo apenas marcadores bialélicos com frequência alelo raro maior que 0,05, valor de chamada de SNPs maior que 0,95 e desequilíbrio de ligação (r2) menor que 0,99. O estudo de associação ampla do genoma (GWAS) foi realizado incorporando a matriz de relacionamento genômico e três componentes principais para lidar com a estrutura do painel. Usando o conjunto de dados filtrado, foram analisadas as características proporção de plantas sobreviventes (PSP), nota de sanidade das plantas sobreviventes (SSSP) e nota de sanidade total (WSS), cujas mensurações ocorreram em dois locais no estado de São Paulo, Brasil. O conjunto de dados brutos incluiu 196.803 SNPs bem distribuídos pelos cromossomos. A proporção de dados faltantes foi de 0,391 e a heterozigosidade média observada foi de 0,036. O conjunto de dados filtrados, contendo 14.655 SNPs, apresentou estimativas semelhantes de parâmetros genéticos populacionais em comparação ao primeiro conjunto. A análise da estrutura do painel apontou a existência de nove subpopulações. Através da GWAS, 13 marcadores foram significativos para as características avaliadas e apresentaram funções relacionadas principalmente ao metabolismo da celulose, via da auxina, genes de defesa e resposta associados à atividade de fagócito oxidase e produção de antocianinas. Os genes candidatos foram associados, por exemplo, à resposta do acúmulo de glicose nas folhas, redução do teor de auxina na planta e ataque direto aos patógenos. Para cada característica, foi possível identificar linhagens com todos os alelos favoráveis em homozigose, o que facilitaria a transferência de genes de resistência para outros genótipos. Além disso, as linhagens advindas do ancestral PF-41X05-33-05B apresentaram alta concentração de alelos favoráveis a todas as características simultaneamente. Os presentes resultados revelam mecanismos genéticos subjacentes desencadeados por plantas em resposta ao complexo do enfezamento do milho e permitiram a identificação de potenciais linhagens resistentes. Tais inferências podem melhorar substancialmente os ganhos genéticos quando incorporadas em programas de melhoramento e constituem uma importante contribuição para a compreensão genética do germoplasma de milho tropical

    Mapeamento associativo em milho para tolerância a seca: variedades crioulas e testcross precoces como fonte de novo alelos

    No full text
    Maize (Zea mayz L.) production worldwide have been facing a tremendous obstacle in the past years, drought events are increasing in frequency and severity, mainly in tropical and subtropical regions. Moreover, climate change forecasts this as a trend for the next few years as well. The maize production can be highly affected by water deficiency stress, resulting in losses in grain yield. Mexico is the center of origin of maize, and there are many diversity centers across Latin America. This diversity should be exploited by breeding programs once it is a source of new alleles that can be responsible for the needed genetic improvements to face the forecasting challenges. This doctoral thesis addresses the theme in two sections. First, we present a review of maize genetic diversity, the use of landraces introduction in breeding programs to improve for drought tolerance, highlighting the importance to develop improved tropical germplasm to face the drought issue. In this review we also discuss the opportunity to apply Genome-Wide Associations Studies (GWAS) and Marker-Assisted Selection (MAS) in this context. In the second section we present an original GWAS application in a pre-breeding program using selected landraces as genetic sources for drought tolerance maize improvement. The aim was to tudy the genetic resources of a landrace panel to identify maize chromosomal regions associated with drought tolerance. For that, we performed the GWAS in 1306 landraces progenies originated from 20 landraces populations selected due to its agricultural performance in dry regions of Latin America. Phenotypic data were obtained from early testcross trials of two generations (BC1S1 in 2016 and BCS2 in 2017) conducted in two water regimes, irrigated and drought condition, in three locations in Mexico. Harmonic Mean of Relative Performance (HMRP) of grain yield in both water regimes was used as a measure of drought tolerance of the genotypes. The genotypic values were estimated using a spatial adjustment in a two-stage analysis. A final set of 5,695 single-nucleotide polymorphism (SNPs) markers was considered for GWAS. We were able to detect a total of 10 significant markers associated with grain yield and drought tolerance index, and we suggest two putative genes mapped close to two of these markers that can be part of the plant\'s response to drought stress. Besides, for two associated SNPs, the alleles from landraces provided a slightly higher yield under drought conditions. Our results indicate that the diversity delivered by these landraces combined with commercial lines is an exciting strategy to improve maize for drought tolerance.A produção de milho ao redor do mundo vem apresentando uma grande dificuldade nos últimos anos, eventos de seca estão se tornando mais frequentes e severos, principalmente em regiões tropicais e subtropicais. Além disso, as mudanças climáticas têm sugerido que isso é uma tendência real para os próximos anos. O estresse causado pela deficiência hídrica nas lavouras de milho pode resultar em grandes quebras de produtividade de grãos. O México é o centro de origem do milho, e diversos são os centros de diversidade genética espalhados pela América Latina. Toda essa diversidade deve ser explorada pelos programas de melhoramento, já que ela é uma extraordinária fonte de novos alelos que podem ter um papel fundamental nos ganhos genéticos alcançados pelo melhoramento nos próximos anos colaborando para o enfrentamento dos desafios que são previstos. Esta tese de doutorado aborda o tema em duas partes. Primeiro, apresentamos uma revisão sobre a abundante diversidade genética do milho, e o uso de variedades crioulas nos programas de melhoramento para tolerância a seca, evidenciando a importância de se desenvolver germoplasma tropical adaptado as condições de seca no intuito de contornar este problema. Ainda na revisão, nós discutimos o uso de estudos de Associação Genômica Ampla (GWAS) e seleção assistida por marcadores (MAS) neste contexto. Na segunda parte, apresentamos um trabalho onde utilizamos GWAS em um programa de pré-melhoramento de milho visando tolerância à seca, onde variedades crioulas foram usadas como fonte de diversidade genética. O objetivo foi estudar os recursos genéticos oferecidos por um painel inicial de crioulas para identificar as regiões cromossômicas associadas à tolerância à seca. Para tanto, foram utilizadas 1306 progênies oriundas de 20 populações crioulas selecionadas por seu desempenho em regiões secas da América Latina. Dados fenotípicos foram obtidos a partir de testcross precoces de duas gerações (RC1S1 em 2016 e RCS2 em 2017) conduzidos em dois regimes hídricos distintos, um irrigado e outro sob seca, em três locais no México. O índice de média harmônica do desempenho relativo (HMRP), calculado com base nos rendimentos de grãos em ambos os regimes de água, foi utilizado como medida de tolerância à seca dos genótipos. Os valores genotípicos foram estimados usando ajuste espacial em uma análise de dois estágios. Um conjunto final de 5695 marcadores de polimorfismo de nucleotídeo único (SNPs) foi considerado para o mapeamento associativo. Como resultados, pudemos detectar um total de 10 marcadores significativos associados ao rendimento de grãos e ao índice de tolerância à seca, e sugerimos dois genes putativos mapeados próximos a dois desses marcadores que podem ter importante participação na resposta da planta ao estresse hídrico. Além disso, para dois SNPs associados, alelos originários das variedades crioulas resultaram em um rendimento ligeiramente maior sob condições de seca. Nossos resultados indicam que a diversidade oferecida pelas variedades crioulas combinada com linhagens já melhoradas pode ter um importante papel no melhoramento de milho tropical para a tolerância à seca

    Aprimorando a acurácia da predição genômica em híbridos de milho através de diferentes kernels e redução do subconjunto de marcadores

    No full text
    In plant breeding, genomic prediction (GP) may be an efficient tool to increase the accuracy of selecting genotypes, mainly, under multi-environments trials. This approach has the advantage to increase genetic gains of complex traits and reduce costs. However, strategies are needed to increase the accuracy and reduce the bias of genomic estimated breeding values. In this context, the objectives were: i) to compare two strategies to obtain markers subsets based on marker effect regarding their impact on the prediction accuracy of genome selection; and, ii) to compare the accuracy of four GP methods including genotype × environment interaction and two kernels (GBLUP and Gaussian). We used a rice diversity panel (RICE) and two maize datasets (HEL and USP). These were evaluated for grain yield and plant height. Overall, the prediction accuracy and relative efficiency of genomic selection were increased using markers subsets, which has the potential for build fixed arrays and reduce costs with genotyping. Furthermore, using Gaussian kernel and the including G×E effect, there is an increase in the accuracy of the genomic prediction models.No melhoramento de plantas, a predição genômica (PG) é uma eficiente ferramenta para aumentar a eficiência seletiva de genótipos, principalmente, considerando múltiplos ambientes. Esta técnica tem como vantagem incrementar o ganho genético para características complexas e reduzir os custos. Entretanto, ainda são necessárias estratégias que aumentem a acurácia e reduzam o viés dos valores genéticos genotípicos. Nesse contexto, os objetivos foram: i) comparar duas estratégias para obtenção de subconjuntos de marcadores baseado em seus efeitos em relação ao seu impacto na acurácia da seleção genômica; ii) comparar a acurácia seletiva de quatro modelos de PG incluindo o efeito de interação genótipo × ambiente (G×A) e dois kernels (GBLUP e Gaussiano). Para isso, foram usados dados de um painel de diversidade de arroz (RICE) e dois conjuntos de dados de milho (HEL e USP). Estes foram avaliados para produtividade de grãos e altura de plantas. Em geral, houve incremento da acurácia de predição e na eficiência da seleção genômica usando subconjuntos de marcadores. Estes poderiam ser utilizados para construção de arrays e, consequentemente, reduzir os custos com genotipagem. Além disso, utilizando o kernel Gaussiano e incluindo o efeito de interação G×A há aumento na acurácia dos modelos de predição genômica
    corecore