1,721,048 research outputs found
Nonlinear Two-dimensional Impurity Diffusion in Semiconductors: a Quasi-Linear Numerical Analysis
Some Remarks About the Use of Charge-Neutrality Approximation in the Simulation of Diffusion Processes
PCA disjoint models for multiclass cancer analysis using gene expression data
Motivation: Microarray expression profiling appears particularly promising for a deeper understanding of cancer biology and to identify molecular signatures supporting the histological classification schemes of neoplastic specimens. However, molecular diagnostics based on microarray data presents major challenges due to the overwhelming number of variables and the complex, multiclass nature of tumor samples. Thus, the development of marker selection methods, that allow the identification of those genes that are most likely to confer high classification accuracy of multiple tumor types, and of multiclass classification schemes is of paramount importance.Results: A computational procedure for marker identification and for classification of multiclass gene expression data through the application of disjoint principal component models is described. The identified features represent a rational and dimensionally reduced base for understanding the basic biology of diseases, defining targets for therapeutic intervention, and developing diagnostic tools for the identification and classification of multiple pathological states. The method has been tested on different microarray data sets obtained from various human tumor samples. The results demonstrate that this procedure allows the identification of specific phenotype markers and can classify previously unseen instances in the presence of multiple classes
Marker identification and classification of cancer types using gene expression data and SIMCA
Objectives. High-throughput technologies are radically boosting the understanding of living systems, thus creating enormous opportunities to elucidate the biological processes of cells in different physiological states. In particular, the application of DNA microarrays to monitor expression profiles from tumor cells is improving cancer analysis to levels that classical methods have been unable to reach. However, molecular diagnostics based on expression profiling requires addressing computational issues as the overwhelming number of variables and the complex, multi-class nature of tumor samples. Thus, the objective of the present research has been the development of a computational procedure for feature extraction and classification of gene expression data.Methods. The Soft Independent Modeling of Class Analogy (SIMCA) approach has been implemented in a data mining scheme, which allows the identification of those genes that are most likely to confer robust and accurate classification of samples from multiple tumor types.Results: The proposed method has been tested on two different microarray data sets, namely Golub's analysis of acute human leukemia [1] and the small round blue cell tumors study presented by Khan et al. [2]. The identified features represent a rational and dimensionally reduced base for understanding the biology of diseases, defining targets of therapeutic intervention, and developing diagnostic tools for classification of pathological states.Conclusions: The analysis of the SIMCA model residuals allows the identification of specific phenotype markers. At the some time, the class analogy approach provides the assignment to multiple classes, such as different pathological conditions or tissue samples, for previously unseen instances
Matrici di DNA per lo studio dell’espressione genica
Le ricerche svolte negli ultimi anni nel campo della biologia molecolare e della genetica hanno reso possibile lo sviluppo e la commercializzazione di una serie di tecnologie per l’analisi delle molecole costituenti gli organismi viventi. In particolare, la messa a punto delle tecniche di amplificazione e sequenziamento del DNA ha aperto la strada ai progetti di mappatura del genoma, tanto che, a tutt’oggi, si conosce l’intera sequenza genica di circa 25 microrganismi e si presume che già nei prossimi mesi sarà disponibile una prima stesura della sequenza genetica dell’uomo. Il risultato di questi progetti è stata la creazione di enormi banche dati che contengono la sequenza di tutti i geni di un particolare organismo e che possono essere utilizzate come vere e proprie mappe utili per lo studio e la comprensione dei meccanismi cellulari. Questa immensa quantità di informazioni rappresenta una delle sfide future delle scienze biologiche, mediche e biotecnologiche in quanto potrà consentire lo sfruttamento della intera sequenza primaria del DNA per l’identificazione delle regioni codificanti e regolatrici, delle variazioni polimorfiche tra le varie specie di organismi, dei meccanismi di sviluppo e degenerazione cellulare e dei sistemi di controllo e di interazione tra le diverse macromolecole biologiche. La complessità e la quantità di dati generati dai diversi progetti genoma pongono tuttavia serie limitazioni al tradizionale approccio riduzionista dell’analisi e dello studio di un gene o di una reazione alla volta e richiedono lo sviluppo di metodiche che permettano l’analisi simultanea di tutti i componenti di un sistema biologico [Lander, 1999]. Le matrici ad alta densità di DNA o di oligonucleotidi (DNA or oligonucleotide microarrays) rappresentano un metodo per esaminare in maniera simultanea e sistematica le variazioni del DNA e dell’RNA all’interno di un organismo e promettono di diventare uno strumento di uso comune nella ricerca medica e biologica. Con i microarray è infatti possibile monitorare i livelli di espressione in maniera sia statica che dinamica, ottenendo, simultaneamente e parallelamente, informazioni sia sulla localizzazione che sulle interazioni dell’espressione di un gene relativamente a quella di tutti gli altri.L’utilizzo delle matrici ad alta densità consentirà di aumentare enormemente la capacità di comprendere la funzione e la regolazione dei geni individuati grazie ai progetti di sequenziamento, purché siano parallelamente sviluppati dei metodi efficaci che consentono di sfruttare l’enorme massa di dati generati da queste tecnologie
- …
