INANOE Repositorio (Inst- Nacional de Astrofísica, Óptica y Electrónica
Not a member yet
2571 research outputs found
Sort by
Taxonomía de asteroides cercanos a la tierra
En este trabajo se reportan los resultados de un estudio espectroscópico de Asteroides
Cercanos a la Tierra (NEAs, por sus siglas en inglés), utilizando datos obtenidos en
varias temporadas de observación entre 2017 y 2020 con el telescopio de 2.12 m del
Observatorio Astrofísico Guillermo Haro (OAGH) ubicado en Cananea, Sonora, utilizando el espectrógrafo Boller & Chivens con una rejilla de 150 l/mm.
El proceso de reducción de los datos se llevo a cabo utilizando el programa IRAF
en su versión del entorno de Python (Pyraf), mediante tareas estándar de limpieza, linealización, calibración en longitud de onda y normalización, para obtener espectros
unidimensionales en el intervalo de 0.4 a 0.9 micras.
La muestra final de estudio fue de 92 NEAs, de los cuales se determinó su clasificación
taxonómica utilizando tres diferentes métodos. Se hace una discusión sobre los mismos
y el porqué de la importancia de utilizarlos y compararlos.
Se encuentra que 42 de los objetos estudiados no contaban con una clasificación taxonómica previa, de tal manera que la asignada en este trabajo es la primera reportada en
la literatura. Para el resto de los objetos de la muestra se les determinó un tipo taxonómico y se comparó con lo reportado en trabajos anteriores.
Este trabajo se realizó en el marco de la colaboración IAWN (International Asteroide
Warning Network) de la cual el INAOE forma parte desde 2015.In this work we report a spectroscopic study of Near-Earth Asteroids (NEAs), using data obtained in several observing seasons between 2017 and 2020 with the 2.12 m telescope of the Guillermo Haro Astrophysical Observatory (OAGH) located in Cananea, Sonora, using a Boller Chivens spectrograph with a 150 l/mm grating.
The data reduction process was performed using Pyraf, a Python environment version
of the IRAF program, by standard cleaning, linearization, wavelength calibration and
normalization tasks to obtain one-dimensional spectra in the range of 0.4 to 0.9 microns
range.
The studied sample consists of 92 NEAs, which were taxonomically classified using
three different methods to determine their taxonomic type. These methods and why it
is important to use them was discussed.
It was found that 42 objects in the sample did not have a previous taxonomic classification, thus the one assigned in this work is the first one reported in the literature.
A taxonomic type was determined also for the rest of the objects in the sample, which
were compared with those reported in previous.
This work was carried out in the framework of the IAWN (International Asteroid Warning Network) collaboration framework, of which INAOE has been a member since 2015
Dispositivos sensibles a la polarización implementados en un sistema de seguridad óptico
Los hologramas, a lo largo de la historia, han formado parte de un repertorio de la óptica básica dedicado únicamente a fines recreativos, sin embargo, en este trabajo usamos técnicas holográficas más especializadas. Empleamos los hologramas como herramientas para grabar y archivar información procesada en campos ópticos, y posteriormente reproducida utilizando una fuente luminosa adecuada. Los hologramas sintéticos de fase (synthetic phase holograms, SPHs) han tenido un gran desarrollo durante las últimas décadas ya que poseen múltiples aplicaciones al ser una importante herramienta para la generación de campos ópticos complejos arbitarios. Para generar un SPH es necesario codificar un campo escalar complejo mediante una función matemática previamente definida. Este tipo de hologramas están modulados en fase y pueden ser grabados o deplegados de diferentes maneras como en una máscara de fase, un modulador espacial de luz, entre otras. En este trabajo de tesis, se emplearon materiales sensibles a la polarización de la luz, lo cual hace que los hologramas sean más particulares, teniendo mayores aplicaciones como elementos de seguridad. Para utilizar estos materiales es necesario aplicar otro tipo de hologramas: los hologramas de polarización. A diferencia de la holografía convencional donde sólo se graban las variaciones de intensidad del patrón de interferencia de la onda del objeto y la onda de referencia, la holografía de polarización emplea haces con polarizaciones ortogonales para codificar la información del campo, ya sea utilizando un objeto real o bien empleando un SPH para generarlo. Para grabar hologramas de polarización es necesario utilizar un medio fotosensible que tenga respuesta a la polarización, éste puede ser algún tipo de azo-polímero amorfo entre otros. Ésto permite almacenar información de la polarización del campo, lo cual es una característica fundamental de los hologramas de polarización. La holografía de polarización es un método de grabado directo, el cual proporciona importantes ventajas, tales como un tiempo corto de escritura, bajas intensidades de grabado, 100 % de eficiencia de difracción y un sistema estable. En este proyecto se presenta el grabado de campos complejos empleando SPHs y utilizando la técnica de holografía de polarización, la cual, se basa en la interferencia de dos ondas polarizadas ortogonalmente, una de estas ondas fue la onda del objeto que se hizo interferir con un haz gaussiano
Caracterización de neuronas piramidales de corteza prefrontal de rata mediante microscopía y visión por computadora
En este reporte, se presentan varias técnicas de procesamiento de imágenes que fueron exploradas y aplicadas con la finalidad de obtener un método de segmentación del área ROI. El método fue cambiando considerando los resultados en cada experimento, hasta encontrar una metodología funcional para la segmentación de la neurona. El cual, se ocupó del alto ruido generado por los medios a través de los cuales se capturó la imagen. Se probó con imágenes de diferentes tipos de neuronas y demostró ser capaz de segmentar adecuadamente las neuronas, a pesar de las diferencias de tamaño y nivel de contraste.
El algoritmo obtiene una segmentación más cercana a los bordes de las neuronas, lo que podría permitir un mayor procesamiento para la reconexión de las dendritas. Los resultados actuales son prometedores y se pueden utilizar para aproximar los datos estimados de la imagen, como el volumen de las neuronas. Deben abordarse dos limitaciones principales relacionadas con la pérdida de los extremos de las dendritas y la toma de partes de neuronas mal segmentadas
Fabricación de microelectrodos a base de silicio para el registro de señales neuronales extracelulares
En la actualidad, con los avances en el estudio de los padecimientos que afectan al ser humano, se conoce que las enfermedades neurodegenerativas impactan en grado variable a un sector importante de la población mundial. Paralelamente, se identifica que los dispositivos de registro de las señales neuronales representan un medio efectivo para realizar estudios avanzados de las enfermedades neurodegenerativas. Un tipo de dispositivo estratégico en este campo son los microelectrodos de registro de las señales eléctricas neuronales, para el análisis de diversos factores degenerativos en el sistema nervioso central y periférico. En el Laboratorio de Microelectrónica del INAOE, se han fabricado dos generaciones de microelectrodos de silicio con múltiples sitios de registro, fundamentalmente se han utilizando técnicas de grabado húmedo anisotrópico a base de hidróxido de potasio (KOH); sin embargo, esta técnica causa grabado lateral principalmente en la punta de las flechas, ocasionando imprecisiones en cuanto a la definición total de la flecha. El principal objetivo de este trabajo, es el de proponer una alternativa de fabricación precisa a base de grabado seco (plasma) de muy alta energía, y con ello definir y caracterizar las etapas de fabricación de los micro- electrodos tridimensionales a base de silicio. El diseño recibido, tiene el propósito de cubrir las funciones de microelectrodos comerciales de uso actual en el Departamento de Farmacología del CINVESTAV-IPN. Por lo anterior el diseño contiene diferentes longitudes, de 2 mm a 6 mm con 18 sitios de registro, pistas de interconexión y pads de salida definidas por una capa doble de aluminio/titanio en la superficie de la flecha. Con este diseño a base de 3 niveles de mascarilla con pistas de cromo, se utilizan obleas de silicio de 200 micras de grueso y 3 etapas de fotolitografía. En la primera etapa del proceso, se crece una capa de óxido aislante de 0.2 μm de grueso. Enseguida se realiza la primera litografía e inmediatamente se depositan las líneas metálicas completas por medio de la técnica de depósito físico en fase vapor (PVD), 0.5 μm de aluminio a una velocidad de 13 Å/s y 0.3 μm de titanio a una velocidad de 7 Å/s, y para obtener la definición precisa de las estructuras metálicas se utilizó la técnica de lift-off.At present, with the advances in the study of the diseases that affect human, it is known that neu- rodegenerative diseases have a variable impact on an important sector of the world’s population. At the same time, it has been identified that devices for recording neuronal signals represent an effective means for advanced studies of neurodegenerative diseases. One type of strategic device in this field is microelectrodes for recording neuronal electrical signals for the analysis of various degenerative factors in the central and peripheral nervous system. In the INAOE Microelectronics Laboratory, two generations of silicon microelectrodes with multiple recording sites have been fabricated, mainly using anisotropic wet etching techniques based on potassium hydroxide (KOH); however, this technique causes lateral etching mainly at the tip of the arrows, causing inaccuracies in terms of the total definition of the arrow. The main objective of this work is to propose a precise manufacturing alternative based on dry et- ching (plasma) of very high energy, and thus define and characterize the manufacturing steps of three-dimensional micro-electrodes based on silicon. The design received, has the purpose of cove- ring the functions of commercial microelectrodes of current use in the Department of Pharmacology of CINVESTAV-IPN. Therefore, the design contains different lengths, from 2 mm to 6 mm with 18 recording sites, interconnection tracks and output pads defined by a double layer of aluminum/titanium on the surface of the shaft. With this 3-level mask-based design with chrome tracks, 200 μm thick silicon wafers and 3 stages of photolithography are used. In the first stage of the process, a 0.2 μm thick insulating oxide layer is grown. Then the first lithography is performed and immediately the complete metallic lines are deposited by means of the physical vapor deposition (PVD) technique, 0.5 μm of aluminum at a rate of 13 Å/s and 0.3 μm of titanium at a rate of 7 Å/s, and to obtain the precise definition of the metallic structures the lift-off technique was used
Explicación de la segmentación semántica no supervisada para la detección de trastornos hematológicos.
La segmentación semántica no supervisada es una técnica en el campo de la visión por computadora que se utiliza para asignar automáticamente etiquetas o clases a los píxeles de una imagen. En el contexto de las imágenes sanguíneas, esta técnica desempeña un papel crucial en el diagnóstico, la automatización, la investigación y la toma de decisiones clínicas en el campo de los trastornos hematológicos. Su importancia radica en mejorar la precisión, la eficiencia y la comprensión de estas enfermedades, lo cual constituye la motivación principal de esta tesis. Para llevar a cabo este estudio, se utilizan imágenes provenientes de la base de datos PKG - C-NMC_Leukemia, cuya composición se describe detalladamente en el presente documento. El enfoque utilizado se basa en una red neuronal convolucional (CNN) que se entrena con imágenes en formato RGB. Además, se emplea el método de inteligencia artificial explicativa RISE (Randomized Input Sampling for Explanation) para generar mapas de calor y así obtener una comprensión más nítida de las decisiones efectuadas por el modelo; en el proceso de generación de mapas de calor mediante el método RISE, se utilizaron conjuntos de 3000, 5000 y 7000 máscaras aleatorias. Cada una de estas máscaras contribuyó a resaltar regiones particulares en las imágenes sanguíneas, subrayando así su importancia para la CNN. Este enfoque, al emplear diferentes cantidades de máscaras, permitió una exploración detallada de las áreas críticas que influyen en las decisiones del modelo. Es importante destacar que este enfoque se basa en el uso de datos no etiquetados y utiliza métodos de aprendizaje automático e inteligencia artificial para identificar y agrupar regiones en la imagen en función de sus características visuales, como color, textura y forma. La combinación de la segmentación semántica no supervisada y la inteligencia artificial explicativa permite identificar y delimitar las regiones de interés en las imágenes sanguíneas, mejorando así el diagnóstico de los trastornos hematológicos.Unsupervised semantic segmentation is a technique in the field of computer vision that is used to automatically assign labels or classes to pixels in an image. In the context of blood images, this technique plays a crucial role in the diagnosis, automation, research, and clinical decision-making in the field of hematological disorders. Its significance lies in improving the accuracy, efficiency, and understanding of these diseases, which is the main motivation of this thesis. To carry out this study, images from the PKG - C-NMC_Leukemia database are used, whose composition is described in detail in this document. The approach used is based on a convolutional neural network (CNN) that is trained with RGB format images. Additionally, the explanatory artificial intelligence method RISE (Randomized Input Sampling for Explanation) is employed to generate heatmaps that visualize the pixels relevant to the decisions made by the neural network. It is important to note that this approach is based on the use of unlabeled data and utilizes machine learning and artificial intelligence methods to identify and group
regions in the image based on their visual characteristics such as color, texture, and shape. The combination of unsupervised semantic segmentation and explanatory artificial intelligence allows for the identification and delineation of regions of interest in blood images, thereby improving the diagnosis of hematological disorders. Furthermore, this approach facilitates task automation, accelerates scientific research in the field, and provides relevant information for informed clinical decision-making
Hardware Architecture Design for Modular Arithmetic Acceleration in Post-Quantum Lattice-Based Cryptography Algorithms
En esta tesis, se presenta el diseño de un módulo de hardware para su integración dentro de las etapas de un procesador RISC-V, el cual es capaz de calcular operaciones aritméticas modulares para los esquemas de criptógrafa post-cuántica CRYSTALS-Kyber (método de encapsulación de llaves) y CRYSTALS-Dilithium (esquema de firma digital). Estos esquemas usan criptografía basada en retículas, para la cual la multiplicación de polinomios toma un porcentaje significativo del tiempo total de ejecución. La arquitectura de hardware propuesta utiliza las configuraciones de mariposa Gentleman-Sande y Cooley-Tukey necesarias en la Transformada Numérico-
Teorica (NTT por sus siglas en inglés) empleada para calcular las multiplicaciones de polinomios. La arquitectura también se aprovecha para operaciones de multiplicación acumulación, suma y resta. Todas las salidas están completamente reducidas módulo q (con q = 3329 para CRYSTALS-Kyber y q = 8380417 para CRYSTALS-Dilithium). El diseño se implementó dentro de los procesadores de código abierto RISC-V de 32 bits STEEL y ORCA, se verifico usando scripts de Octave y código en SystemVerilog, y se validó modificando el código C de referencia de los esquemas para hacer uso del hardware diseñado, el cual se sintetizó para FPGAs Artix-7. Se alcanzó un factor de aceleración de al menos 2.09 para el algoritmo NTT en comparación con el tiempo de ejecución del código de referencia en los procesadores no modificados. También logra una mejor eficiencia considerando un producto LUTs*tiempo de ejecución en comparación con la implementación estrechamente acoplada del estado del arte para CRYSTALS-Dilithium en un procesador RISC-V de 64 bits y una eficiencia competitiva en comparación a implementaciones equivalentes de CRYSTALS-Kyber.In this thesis, we present a hardware module design to be embedded within a RISC-V processor pipeline, capable of computing modular arithmetic operations for the postquantum cryptography schemes CRYSTALS-Kyber (key encapsulation method) and CRYSTALS-Dilithium (digital signature scheme). These schemes use lattice-based cryptography for which the polynomial multiplication takes a significant percentage of the total run time. The proposed hardware architecture uses the Gentleman-Sande and Cooley-Tukey butterfly configurations needed in the Number Theoretic Transform (NTT) employed for computing the polynomial multiplications. The architecture is also exploited for multiply-accumulate, addition, and subtraction operations. All outputs are completely reduced modulo q (with q = 3329 for CRYSTALS-Kyber and q = 8380417 for CRYSTALS-Dilithium). The design was implemented within the open-source RISC-V 32-bit processors STEEL and ORCA, verified using Octave scripts and SystemVerilog code, and validated by modifying the schemes’ reference C code to make use of the designed hardware synthesized for Artix-7 FPGAs. It reaches a speedup factor of at least 2.09 for the NTT algorithm compared to unmodified processors’ reference code run time. It also achieves a better efficiency considering a LUTs*time product when compared to the tightly coupled state-of-the-art implementation for CRYSTALS-Dilithium in a 64-bit RISC-V processor and a competitive efficiency when compared to CRYSTALS-Kyber equivalent implementations
A very deep super resolution approach for blind tampering reconstruction based on reversible image authentication
Reversible Image Authentication (RIA) involves a data hiding process in which watermarks are imperceptibly embedded into an image to protect it against tampering attacks. If a marked image is not tampered, then watermarks can be erased from the marked image and the original cover image is obtained without distortion. This is possible because Reversible Data Hiding (RDH) techniques are used to strategically embed the watermark bits into the image to allow reversibility. Recovery information can be afforded as part of the watermark for reconstruction of tampered image regions. However, most state-of-the-art works discard the reconstruction problem as a consequence of limited embedding capacity offered by existing RDH methods. Although some RIA methods have addressed the tampering reconstruction problem, most of them provide low-quality reconstructed images. To overcome this issue, recovery information must be carefully selected and used for reconstruction to provide images of better quality. In this thesis, we propose a new RIA scheme with reconstruction capabilities. The proposed scheme introduces a reconstruction strategy based on the Very Deep Super Resolution (VDSR) network. In this way, sparse signal representations of down-scaled image blocks are obtained to create the recovery information using compressed sensing theory. Simultaneously, a coefficient elimination phase is applied in order to enhance the sparse signal representation of each image block. Watermarks are reversibly embedded into the high-frequency Integer Wavelet Transform (IWT) coefficients of the blocks using companding technique. The proposed scheme is evaluated over a dataset of 135 benchmark images in terms of watermark imperceptibility, tampering detection accuracy, and reconstruction quality, employing Peak Signal-to-Noise Ratio (PSNR) and Structural Similarity Index (SSIM) metrics. Experimental results indicate that the proposed scheme outperforms previous state-of-the-art methods; in both, reconstruction quality and runtime. The proposed scheme achieves a PSNR improvement of up to +8 dB in terms of image reconstruction quality while runtime is significantly reduced in sparse signal approximation phase, running ≈ 64% faster than previous methods, which is a result of dealing with downscaled image blocks
Plasmonic Structural Color and Sensing
n recent years, nanostructures have gained prominence in the field of structural color due to the presence of plasmonic resonances within the visible frequency spectrum. In nature, we find examples of nanostructures that produce color through optical mechanisms such as refraction, reflection, scattering, and interference. Colors generated by these mechanisms tend to be purer and can encompass a wide range. One critical advantage of nanostructures is their ability to manipulate light, which holds great potential for various optical applications. However, manufacturing these nanostructures is intricate, requiring methods like nanoimprinting or lithography to create periodic patterns. This complexity can result in high production costs, posing challenges for widespread industrial implementation. The primary objective of this thesis centers on the investigation, fabrication, and experimental analysis of a plasmonic structure designed for easy manipulation, particularly in generating structural color. This structure comprises a layer of aluminum, a thin layer of aluminum oxide (Al2O3), and a layer of aluminum nanoislands. Its fabrication requires electron beam evaporation to deposit the aluminum layer and grow the nanoislands, and for depositing the Al2O3 layer, the technique of atomic layer deposition (ALD) is used. It's noteworthy that this structure can be readily applied to flexible surfaces. Using the same nanoisland growth method, we also explored the manufacturing and analysis of a potential application - specifically, a humidity and temperature sensor. Here, a polymer served as a modification medium within the nanostructure, resulting in a tunable color response to changes in humidity and temperature. Finally, we briefly introduce a novel nanostructure composed of Vo2 exhibiting structural color. This material possesses thermoelectric properties, leading to a color shift in response to variations in temperature and voltage, thus displaying structural coloration.En los recientes años las nanoestructuras han tenido grandes logros en el campo del color estructural, debido a la presencia de resonancias plasmonicas dentro del espectro de frecuencias visibles. En la naturaleza encontramos ejemplos de nanoestructuras que producen color atreves de mecanismos ópticos tales como refracción, reflexión, esparcimiento e interferencia. Los colores generados por estos mecanismos tienden a ser puros y pueden abarcar una gama amplia. Una ventaja fundamental de las nanoestructuras es su habilidad para manipular la luz, lo que tiene un gran potencial para diversas aplicaciones ópticas. Sin embargo, la fabricación de estas nanoestructuras es compleja y requiere métodos como la nanoimpresión o la litografía para crear patrones periódicos. Esta complejidad puede resultar en altos costos de producción, lo que plantea desafíos para la generalizada implementación industrial. El objetivo principal de esta tesis se centra en la investigación, fabricación y análisis experimental de una estructura plasmónica diseñada para una fácil manipulación, particularmente en la generación de color estructural. Esta estructura contiene una capa de aluminio, una fina capa de óxido de aluminio (Al2O3) y una capa de nanoislas de aluminio. La fabricación requiere evaporación por haz electrones para el depósito de una capa de aluminio y crecimiento de nanoislas; para el depósito de la capa de Al2O3 es usada la técnica de deposición de capas atómicas, demostrando que la estructura se puede aplicar fácilmente a superficies flexibles. Utilizando el mismo método de crecimiento de nanoislas exploramos la fabricación y el análisis de una potencial aplicación, específicamente, un sensor de humedad y temperatura. En este caso, un polímero sirvió como medio de modificación dentro de la nanoestructura, lo que dio como resultado una respuesta de color ajustable a los cambios de humedad y temperatura. Finalmente, presentamos brevemente una nueva nanoestructura compuesta de VO2 que exhibe color estructural. Este material posee propiedades termoeléctricas, lo que provoca un cambio de color en respuesta a las variaciones de temperatura y voltaje, mostrando así una coloración estructural
The Gravoturbulent Interplay between Star Cluster Feedback and Sequential Star Formation in NGC 1569-A
Super star clusters dominate the dynamics and evolution in the central region of the galaxy NGC 1569. Recent studies have determined different ages and complex morphology within the clusters, allowing to create complicated structures of gas related with superbubbles, HII regions and the gas leftover from star formation. Using 3-D hydrodynamic techniques, I have studied the formation of a second star cluster very near to an existing massive star cluster in NGC 1569. The two star clusters are separated by a mere 3 pc in projection and have an age difference of only 3 Myr. This study provides insights into the viability of the second cluster’s formation in a
challenging environment influenced by the feedback from the first star cluster.La dinámica y la evolución en la región central de la galaxia NGC 1569 está dominada por la presencia de algunos supercúmulos estelares. Estudios recientes han determinado diferentes edades y una morfología compleja dentro de los cúmulos, lo que permite crear estructuras complicadas de gas relacionadas con superburbujas, regiones HII y el gas remanente de la formación estelar. Utilizando técnicas hidrodinámicas en 3-D, he estudiado la formación de un cúmulo estelar muy cerca de un cúmulo estelar masivo existente en NGC 1569. Los dos cúmulos estelares están separados por sólo 3 pc en proyección y tienen una diferencia de edad de sólo 3 millones de años. Este estudio proporciona información sobre las condiciones de viabilidad para la formación del segundo cúmulo estelar en un entorno desafiante influenciado por la retroalimentación del primer cúmulo estelar
Detection of violent incidents in Spanish using multimodal information from social networks
Violence (intentional use of force/power against a person, group, or community usually to obtain something) can have repercussions ranging from individuals to nations and is an inherent part of daily life in Latin American populations. However, detecting violent incidents on time or even as prevention is highly complex despite the continuous attempts to detect and
predict them. Due to the complexity of the problem, there is uncertainty in the sources of information and the characteristics that should be used for its automatic detection, added to that labeled data of violent incidents are scarce, and in certain languages such as Spanish null.
In this thesis, we explore the multimodality of models and data that can be extracted from social networks, for the detection of violent incidents in Spanish, we study their performance for the specific detection task and the multi-labeling task. In addition, we present a study of some multimodal fusion methods to improve performance compared to unimodal methods on the extracted dataset, with a focus on models based on transformers. Automatic trend detection methods such as bidirectional encoder representations from transformers (BERT), vision transformer (ViT), or vision and language transformer (ViLT) are used. The experiments are carried out using a self-created database consisting of two corpus with the same theme
“violent incidents in Spanish” but with different purposes of classifying and training models of masked language, both with visual and textual modality. Summarizing, in this thesis we design and recover a multimodal database in Spanish of violent incidents divided into 2 corpus and we study multimodal models to provide evidence for the idea that multimodal fusion is a good approach for the detection of violent incidents; Therefore, we present one of the first works focused on the detection of multimodal violent incidents in Spanish that includes the
construction of a database and attempts to classify incidents into 9 different categories, beyond incident identification, including the first corpus (to the best of the Authors knowledge) in Spanish of multi-label violent incidents.La violencia (uso intencional de la fuerza/poder contra una persona, grupo o comunidad
usualmente con la intención de obtener algo) puede tener repercusiones desde personales hasta
nacionales y es parte inherente de la vida diaria en las poblaciones latinoamericanas. Sin
embargo, detectar incidentes violentos de forma oportuna o incluso como prevención tiene una
alta complejidad a pesar de nuestros continuos intentos por detectarla y predecirla. En virtud
de la complejidad, hay incertidumbre en las fuentes de información y las características que
deberían ser usadas para su detección automática, aunado a eso datos etiquetados de incidentes
violentos son escasos y en ciertos idiomas como el español básicamente nulos. En esta tesis,
exploramos la multimodalidad de modelos y datos que pueden ser extraídos en redes sociales,
para la detección de incidentes violentos en español, estudiamos su desempeño para la tarea
específica de detección y para la tarea de multi-etiquetado. Además, presentamos un estudio de
algunos métodos de fusión multimodal con el objetivo de mejorar el desempeño en comparación
a los métodos unimodales en el conjunto de datos extraído, con enfoque en modelos basados
en transformers. Se hace uso de métodos de detección automática en tendencia como BERT,
ViT o ViLT (de uso libre). Los experimentos se llevan a cabo usando una base de datos de
creación propia y que consiste en dos corpus con la misma temática “incidentes violentos en
español” pero con los fines distintos clasificar y entrenar modelos de lenguaje enmascarado,
ambos con la modalidad visual y textual. Resumiendo, en esta tesis se diseña y recupera una
base de datos multimodal en español de incidentes violentos dividida en 2 corpus y estudiamos
modelos multimodales para aportar evidencia a la idea de que la fusión multimodal es un buen
acercamiento para la detección de incidentes violentos; con dicha evidencia, presentamos uno
de los primeros trabajos enfocados en detección de incidentes violentos multimodal en español
que incluye la construcción de una base de datos y que intenta clasificar los incidentes en
9 categorías distintas, más allá de identificación de incidentes, incluyendo el primer corpus
(hasta donde sabemos) en español de incidentes violentos multi-etiqueta