Journal of Information Technology and Computer Science (JOINTECS)
Not a member yet
168 research outputs found
Sort by
PEMBELAJARAN MESIN UNTUK PREDIKSI STROKE BERDASARKAN RANDOM FOREST DAN SHAP
Dengan lebih dari 12,2 juta kasus baru per tahun, stroke adalah penyebab utama kematian dan disabilitas diseluruh dunia. Deteksi dini sangat penting untuk mengurangi kematian dan komplikasi jangka panjang. Untukmeningkatkan transparansi dan keandalan keputusan model, penelitian ini mengembangkan model prediksistroke yang berbasis algoritma random forest. Metode interpretasi SHAP (Shapley Additive Explanations) jugadigunakan. Hasil evaluasi menunjukkan bahwa model random forest memiliki kemampuan untuk mencapai F1-score sebesar 99,99%, akurasi, presisi, dan recall, dengan AUC sebesar 0,989 ± 0.002, yang menunjukkankinerja klasifikasi yang sangat baik. Dengan menggunakan visualisasi SHAP seperti summary plot, dependenceplot, dan force plot, ditemukan bahwa elemen seperti usia, kadar glukosa darah, dan BMI memainkan peranutama dalam meningkatkan risiko stroke. Interaksi antar elemen, seperti usia lanjut dengan kadar glukosa tinggi,meningkatkan kemungkinan stroke hingga 85%, dibandingkan dengan nilai dasar rata-rata 0,4992. Pendekatanini tidak hanya menghasilkan prediksi yang akurat, tetapi juga memungkinkan interpretasi yang dapat dipahamioleh tenaga medis. Hal ini mendukung penerapan model dalam konteks klinis sebagai alat bantu dalam diagnosisdan pengambilan keputusan preventifDengan lebih dari 12,2 juta kasus baru per tahun, stroke adalah penyebab utama kematian dan disabilitas di seluruh dunia. Deteksi dini sangat penting untuk mengurangi kematian dan komplikasi jangka panjang. Untuk meningkatkan transparansi dan keandalan keputusan model, penelitian ini mengembangkan model prediksi stroke yang berbasis algoritma Random Forest. Metode interpretasi SHAP (Shapley Additive Explanations) juga digunakan. Hasil evaluasi menunjukkan bahwa model Random Forest memiliki kemampuan untuk mencapai F1-score sebesar 99,99%, akurasi, presisi, dan recall, dengan AUC sebesar 0,989 ± 0.002, yang menunjukkan kinerja klasifikasi yang sangat baik. Dengan menggunakan visualisasi SHAP seperti summary plot, dependence plot, dan force plot, ditemukan bahwa elemen seperti usia, kadar glukosa darah, dan BMI memainkan peran utama dalam meningkatkan risiko stroke. Interaksi antar elemen, seperti usia lanjut dengan kadar glukosa tinggi, meningkatkan kemungkinan stroke hingga 85%, dibandingkan dengan nilai dasar rata-rata 0,4992. Pendekatan ini tidak hanya menghasilkan prediksi yang akurat, tetapi juga memungkinkan interpretasi yang dapat dipahami oleh tenaga medis. Ini juga mendukung penerapan model dalam konteks klinis sebagai alat bantu dalam diagnosis dan pengambilan keputusan preventif
COBIT 2019 for IT Service Quality at Institute Of Business Timor Leste
The era of digitalization requires educational institutions to optimize the quality of information technology (IT) services tosupport academic and administrative operations. The researcher aims to evaluate and improve IT governance at IOB using theCOBIT 2019 framework domain APO11 (Managed Quality), to measure the maturity level (capability level) and providerecommendations for improvement. Research methods included questionnaires, semi-structured interviews, and documentanalysis of five APO11 subdomains such as establishing a quality management system, managing quality processes, continuousimprovement, monitoring, and integration with the business. Results showed variations in capability level, APO11.03(Continuous Improvement) reached the highest level (CL 3 - Defined), APO11.01 (IT Quality Policy) and APO11.05(Business-IT Integration) were still at the basic level (CL 1 - Performed), indicating the need for policy standardization andalignment of IT with organizational strategy. Technical recommendations include drafting formal policy documents,implementing automated monitoring tools, staff training based on COBIT 2019 and ITIL. Recommendations improve thequality of IT services on an ongoing basis, achieving the target of CL 4 (Managed) within the next 2-3 years. The COBIT 2019approach is effective in identifying IT governance gaps and providing structured solutions for educational institutions indeveloping countries such as Timor Leste.The era of digitalization requires educational institutions to optimize the quality of information technology (IT) services to support academic and administrative operations. The researcher aims to evaluate and improve IT governance at IOB using the COBIT 2019 framework domain APO11 (Managed Quality), to measure the maturity level (capability level) and provide recommendations for improvement. Research methods included questionnaires, semi-structured interviews, and document analysis of five APO11 subdomains such as establishing a quality management system, managing quality processes, continuous improvement, monitoring, and integration with the business. Results showed variations in capability level, APO11.03 (Continuous Improvement) reached the highest level (CL 3 - Defined), APO11.01 (IT Quality Policy) and APO11.05 (Business-IT Integration) were still at the basic level (CL 1 - Performed), indicating the need for policy standardization and alignment of IT with organizational strategy. Technical recommendations include drafting formal policy documents, implementing automated monitoring tools, staff training based on COBIT 2019 and ITIL. Recommendations improve the quality of IT services on an ongoing basis, achieving the target of CL 4 (Managed) within the next 2-3 years. The COBIT 2019 approach is effective in identifying IT governance gaps and providing structured solutions for educational institutions in developing countries such as Timor Leste
Penerapan VGG16 untuk Klasifikasi Jinak dan Ganas pada Citra Medis
Penelitian ini bertujuan untuk menilai performa model VGG16 dalam klasifikasi citra kulit dengan menggunakan datasetberjumlah 6.929 gambar yang terbagi ke dalam sembilan kategori kanker kulit, terdiri dari empat jenis kanker ganas (KeratosisAktinik, Karsinoma Sel Basal, Karsinoma Sel Skuamosa, dan Melanoma) serta lima jenis kanker jinak (Dermatofibroma, LesiVaskular, Nevus, Keratosis Jinak Berpigmen, dan Keratosis Seboroik). Dataset tersebut telah melalui serangkaian prosespraproses seperti perubahan ukuran, normalisasi, dan augmentasi guna meningkatkan kualitas serta variasi data. Pelatihanmodel dilakukan dengan parameter optimal berupa batch size 16, optimizer Adam, dan 10 epoch. Hasil evaluasi menunjukkanbahwa model VGG16 mampu mencapai akurasi validasi sebesar 99,62%, serta mempertahankan akurasi pelatihan yangmendekati 100% dengan penurunan nilai loss yang stabil hingga mencapai konvergensi. Temuan ini menegaskan bahwaarsitektur VGG16 merupakan solusi yang efektif dan handal untuk klasifikasi citra kulit, dengan potensi aplikasi dalammendukung deteksi dini kanker kulit melalui metode pembelajaran mendalam. Diharapkan hasil penelitian ini dapatmemberikan kontribusi signifikan dalam meningkatkan akurasi dan efisiensi proses diagnostik di bidang layanan kesehatan.Penelitian ini bertujuan untuk menilai performa model VGG16 dalam klasifikasi citra kulit dengan menggunakan dataset berjumlah 6.929 gambar yang terbagi ke dalam sembilan kategori kanker kulit, terdiri dari empat jenis kanker ganas (Keratosis Aktinik, Karsinoma Sel Basal, Karsinoma Sel Skuamosa, dan Melanoma) serta lima jenis kanker jinak (Dermatofibroma, Lesi Vaskular, Nevus, Keratosis Jinak Berpigmen, dan Keratosis Seboroik). Dataset tersebut telah melalui serangkaian proses praproses seperti perubahan ukuran, normalisasi, dan augmentasi guna meningkatkan kualitas serta variasi data. Pelatihan model dilakukan dengan parameter optimal berupa batch size 16, optimizer Adam, dan 10 epoch. Hasil evaluasi menunjukkan bahwa model VGG16 mampu mencapai akurasi validasi sebesar 99,62%, serta mempertahankan akurasi pelatihan yang mendekati 100% dengan penurunan nilai loss yang stabil hingga mencapai konvergensi. Temuan ini menegaskan bahwa arsitektur VGG16 merupakan solusi yang efektif dan handal untuk klasifikasi citra kulit, dengan potensi aplikasi dalam mendukung deteksi dini kanker kulit melalui metode pembelajaran mendalam. Diharapkan hasil penelitian ini dapat memberikan kontribusi signifikan dalam meningkatkan akurasi dan efisiensi proses diagnostik di bidang layanan kesehatan
Evaluasi Komparatif Optimizer pada YOLOv8s untuk Deteksi Alfabet Bahasa Isyarat Indonesia (BISINDO)
Indonesian Sign Language (BISINDO) serves as primary communication for 2.6 million hearing-impaired individuals inIndonesia, yet automatic recognition technology limitations create accessibility barriers. Previous studies lack systematicoptimizer comparisons in YOLOv8s for BISINDO alphabet detection. This study evaluates three optimizers (SGD, AdamW,Adam) on YOLOv8s to determine optimal configuration for best performance and consistency. Methods: Research employedYOLOv8s with pre-trained weights on 12,650 BISINDO alphabet images (70%-20%-10% split). Evaluation conducted through15 deterministic training sessions with five replications per optimizer using deterministic seed. Framework included Accuracy,mAP, Precision/Recall metrics, and confusion matrix analysis. Results: SGD demonstrated superior performance [email protected]:0.95 of 0.94244, precision 0.99188, and recall 0.99756, outperforming AdamW (0.94197) and Adam (0.93845). Alloptimizers achieved perfect consistency with standard deviation 0.0. Confusion matrix revealed 95% alphabet classes achieveddetection rates ≥85% with total error <0.3%. Conclusion: SGD represents optimal optimizer for BISINDO detection withperfect reproducibility providing solid foundation for benchmark reliability in sign language recognition.Bahasa Isyarat Indonesia (BISINDO) merupakan komunikasi utama 2,6 juta penyandang disabilitas pendengaran di Indonesia, namun keterbatasan teknologi pengenalan otomatis menimbulkan hambatan aksesibilitas. Penelitian sebelumnya belum melakukan perbandingan optimizer sistematis pada YOLOv8s untuk deteksi alfabet BISINDO. Penelitian ini mengevaluasi tiga optimizer (SGD, AdamW, Adam) pada YOLOv8s untuk menentukan konfigurasi optimal dengan performa dan konsistensi terbaik. Methods: Penelitian menggunakan YOLOv8s dengan pre-trained weights pada 12,650 images alfabet BISINDO (split 70%-20%-10%). Evaluasi dilakukan melalui 15 sesi pelatihan deterministik dengan lima replikasi per optimizer menggunakan deterministic seed. Framework mencakup metrik Accuracy, mAP, Precision/Recall, dan analisis confusion matrix. Results: SGD menunjukkan performa superior dengan [email protected]:0.95 sebesar 0.94244, precision 0.99188, dan recall 0.99756, mengungguli AdamW (0.94197) dan Adam (0.93845). Semua optimizer mencapai konsistensi sempurna dengan standard deviation 0.0. Confusion matrix mengungkapkan 95% kelas alfabet mencapai detection rate ≥85% dengan total error <0.3%. Conclusion: SGD merupakan optimizer optimal untuk deteksi BISINDO dengan perfect reproducibility memberikan foundation solid untuk benchmark reliability dalam sign language recognition
CNN-LSTM with Transformer-Based Fusion (CLIP: Contrastive Language-Image Pretraining) for Sentiment and Emotion
Sentiment analysis on multimodal data presents significant challenges due to the complex integration of textual and visualinformation, especially in internet memes where meaning often emerges from the interplay between image and text. This studyproposes a hybrid deep learning model that combines Convolutional Neural Networks (CNN) for visual feature extraction,Long Short-Term Memory (LSTM) networks for contextual text understanding, and Contrastive Language–Image Pretraining(CLIP) as a transformer-based fusion mechanism to align both modalities in a shared semantic space. Evaluated on theMemotion 7K dataset, the proposed model achieves an accuracy of 85.6%, outperforming baseline architectures such as CNNLSTM (78.3%) and BERT-DenseNet (81.2%). Experimental results demonstrate that CLIP’s contrastive learning significantlyenhances the model’s ability to interpret ambiguous and sarcastic content by capturing nuanced text-image relationships. Thesystem shows balanced performance across sentiment classes, with strong precision and recall metrics, confirming itsrobustness. This research contributes a methodologically sound framework for multimodal sentiment analysis and offerspractical implications for real-world applications such as social media monitoring, digital marketing, and cross-culturalcontent understanding. Future work includes multilingual dataset expansion, computational optimization for deployment, andintegration of additional modalities like audio or video to further enrich emotional context
Evaluasi Manajemen Risiko Teknologi Informasi Menggunakan Framework COBIT 2019
Perkembangan era digital menjadikan teknologi informasi (TI) sebagai komponen krusial dalam operasional organisasi,termasuk di sektor pemerintahan. Lembaga legislatif sebagai penyelenggara negara sangat bergantung pada sistem TI untukmendukung kegiatan administratif, komunikasi, dan pengelolaan data. Namun, ketergantungan ini berpo-tensi menimbulkanrisiko seperti ancaman keamanan siber, kehilangan data, dan ketidakpatuhan terhadap regulasi. Penelitian ini bertujuan untukmengevaluasi manajemen risiko TI pada suatu lembaga pemerintah menggunakan framework COBIT 2019, dengan fokus pada domain APO12 (Managed Risk). Metode penelitian yang digunakan adalah studi kasus dengan pendekatan kualitatif, dimana data dikumpulkan melalui wawancara, kuesioner, dan studi literatur. Analisis dilakukan berdasarkan tahapanidentifikasi, analisis, evaluasi, dan mitigasi risiko sesuai kerangka kerja COBIT 2019. Hasil penelitian diharapkan dapatmengidentifikasi kerentanan sistem TI, menilai tingkat kepatuhan terhadap standar tata kelola TI, serta merumuskan rekomendasi peningkatan manajemen risiko. Secara praktis, temuan penelitian memberikan manfaat dalam pengoptimalan tatakelola TI dan pencapaian kepatuhan terhadap standar global. Selain itu, hasil studi ini dapat menjadi referensi bagi organisasisejenis dalam menerapkan framework COBIT 2019 untuk pengelolaan risiko TI yang lebih efektif.Perkembangan era digital menjadikan teknologi informasi (TI) sebagai komponen krusial dalam operasional organisasi, termasuk di sektor pemerintahan. Lembaga legislatif sebagai penyelenggara negara sangat bergantung pada sistem TI untuk mendukung kegiatan administratif, komunikasi, dan pengelolaan data. Namun, ketergantungan ini berpo-tensi menimbulkan risiko seperti ancaman keamanan siber, kehilangan data, dan ketidakpatuhan terhadap regulasi. Penelitian ini bertujuan untuk mengevaluasi manajemen risiko TI pada suatu lembaga pemerintah menggunakan framework COBIT 2019, dengan fokus pa-da domain APO12 (Managed Risk). Metode penelitian yang digunakan adalah studi kasus dengan pendekatan kualitatif, di mana data dikumpulkan melalui wawancara, kuesioner, dan studi literatur. Analisis dilakukan berdasarkan tahapan identifikasi, analisis, evaluasi, dan mitigasi risiko sesuai kerangka kerja COBIT 2019. Hasil penelitian diharapkan dapat mengidentifikasi kerentanan sistem TI, menilai tingkat kepatuhan terhadap standar tata kelola TI, serta merumuskan rek-omendasi peningkatan manajemen risiko. Secara praktis, temuan penelitian memberikan manfaat dalam pengoptimalan tata kelola TI dan pencapaian kepatuhan terhadap standar global. Selain itu, hasil studi ini dapat menjadi referensi bagi organisasi sejenis dalam menerapkan framework COBIT 2019 untuk pengelolaan risiko TI yang lebih efektif
Tuan, Doktor Implementasi Metode STORET Pada Pelabelan Kualitas Air Dengan SVM, XGBoost dan Gradient Boosting: Implementasi Metode STORET Pada Pelabelan Kualitas Air Dengan SVM, XGBoost dan Gradient Boosting
Pelabelan kualitas air yang tidak akurat akibat bias seperti underestimate dan overestimate dapat berdampak pada kesalahandalam evaluasi data. Kesalahan ini pada akhirnya dapat memengaruhi pengambilan keputusan dalam prediksi kualitas airbudidaya ikan. Penelitian ini bertujuan mendalami efektivitas metode STORET dalam pelabelan kualitas air yangdirekomendasikan oleh Direktur Pengendalian Pencemaran Air di indonesia, serta mengintegrasikannya dengan modelklasifikasi pada machine learning untuk meningkatkan akurasi prediksi pada kualitas air budidaya ikan. Tiga modelklasifikasi yang digunakan dalam penelitian ini, yaitu XGBoost, Gradient Boosting, dan SVM. Dataset yang digunakandidapatkan dari website kaggle yang telah melalui proses pelabelan berdasarkan Water Quality Index dengan label SangatBaik, Baik, Sedang dan Buruk, kemudian dilakukan pelatihan model menggunakan metode K-Fold 5 dan K-Fold 10. Hasilevaluasi menunjukkan bahwa XGBoost menghasilkan performa terbaik dengan nilai akurasi sebesar 0,9432 pada K-Fold 5dan meningkat menjadi 0,9457 pada K-Fold 10. Model ini juga menunjukkan nilai presisi, recall, dan F1-score yangkonsisten tinggi dibandingkan model lainnya. Temuan ini menunjukkan bahwa kombinasi pelabelan STORET dan modelXGBoost dapat digunakan secara efektif dalam memprediksi kualitas air berdasarkan parameter-parameter yang telahditentukan. Penelitian ini membuka peluang penerapan lebih lanjut dalam sistem pemantauan kualitas air berbasis IoT untukmendukung manajemen budidaya perairan yang lebih cerdas dan adaptif.Pelabelan kualitas air yang tidak akurat akibat bias seperti underestimate dan overestimate dapat berdampak pada kesalahan dalam evaluasi data. Kesalahan ini pada akhirnya dapat memengaruhi pengambilan keputusan dalam prediksi kualitas air budidaya ikan. Penelitian ini bertujuan mendalami efektivitas metode STORET dalam pelabelan kualitas air yang direkomendasikan oleh Direktur Pengendalian Pencemaran Air, serta mengintegrasikannya dengan model klasifikasi pada machine learning untuk meningkatkan akurasi prediksi pada kualitas air budidaya ikan. Tiga model klasifikasi yang digunakan dalam penelitian ini, yaitu XGBoost, Gradient Boosting, dan SVM. Dataset yang digunakan didapatkan dari kaggle yang telah melalui proses pelabelan berdasarkan Water Quality Index dengan metode STORET, kemudian dilakukan pelatihan model menggunakan metode K-Fold 5 dan K-Fold 10. Hasil evaluasi menunjukkan bahwa XGBoost menghasilkan performa terbaik dengan nilai akurasi sebesar 0,9432 pada K-Fold 5 dan meningkat menjadi 0,9457 pada K-Fold 10. Model ini juga menunjukkan nilai presisi, recall, dan F1-score yang konsisten tinggi dibandingkan model lainnya. Temuan ini menunjukkan bahwa kombinasi pelabelan STORET dan model XGBoost dapat digunakan secara efektif dalam memprediksi kualitas air berdasarkan parameter-parameter yang telah ditentukan. Penelitian ini membuka peluang penerapan lebih lanjut dalam sistem pemantauan kualitas air berbasis IoT untuk mendukung manajemen budidaya perairan yang lebih cerdas dan adaptif
Model Sistem IoT Untuk Kontrol Pakan Otomatis Pada Budidaya Lobster Air Tawar Berbasis Fuzzy Logic
Budidaya lobster air tawar, khususnya Cherax Quadricarinatus (redclaw crayfish), memiliki potensi ekonomi besarkarena tingginya permintaan pasar. Namun, tantangan utama adalah menentukan takaran pakan optimal untuk mendukungpertumbuhan lobster sekaligus mengurangi pemborosan yang dapat mencemari lingkungan. Penelitian ini mengusulkansistem berbasis IoT dengan logika fuzzy logic untuk kontrol pakan otomatis, menggunakan model fuzzy Mamdani. Model inimenggunakan input berupa data historis suhu, pH air, dan berat lobster, serta data sintetis untuk analisis sensitivitas. Hasilmenunjukkan bahwa model logika fuzzy mampu memberikan rekomendasi takaran pakan yang dinamis berdasarkan variasiinput, dengan hubungan tidak linear antara suhu dan pH terhadap takaran pakan. Misalnya, pada rentang suhu 230C –250C,kenaikan 20C meningkatkan takaran pakan sebesar 15,183%, sedangkan pada rentang 290C –310C, kenaikan yang samamengurangi takaran pakan sebesar 13,18%. Proses defuzzifikasi dengan metode centroid menghasilkan nilai tegas yangmempertimbangkan distribusi keanggotaan dari seluruh istilah linguistik. Penelitian ini berkontribusi pada penerapan sistemIoT berbasis logika fuzzy untuk kontrol pakan otomatis pada budidaya lobster air tawar, meningkatkan efisiensi pemberianpakan, mengurangi pemborosan, dan mendukung produktivitas yang berkelanjutan. Penelitian lanjutan disarankan untukmenambahkan parameter lain dan menggunakan machine learning untuk peramalan pertumbuhan serta mitigasi risikokematian.Budidaya lobster air tawar, khususnya Cherax Quadricarinatus (redclaw crayfish), memiliki potensi ekonomi besar karena tingginya permintaan pasar. Namun, tantangan utama adalah menentukan takaran pakan optimal untuk mendukung pertumbuhan lobster sekaligus mengurangi pemborosan yang dapat mencemari lingkungan. Penelitian ini mengusulkan sistem berbasis IoT dengan logika fuzzy logic untuk kontrol pakan otomatis, menggunakan model fuzzy Mamdani. Model ini menggunakan input berupa data historis suhu, pH air, dan berat lobster, serta data sintetis untuk analisis sensitivitas. Hasil menunjukkan bahwa model logika fuzzy mampu memberikan rekomendasi takaran pakan yang dinamis berdasarkan variasi input, dengan hubungan tidak linear antara suhu dan pH terhadap takaran pakan. Misalnya, pada rentang suhu 23℃–25℃, kenaikan 2℃ meningkatkan takaran pakan sebesar 15,183%, sedangkan pada rentang 29℃–31℃, kenaikan yang sama mengurangi takaran pakan sebesar 13,18%. Proses defuzzifikasi dengan metode centroid menghasilkan nilai tegas yang mempertimbangkan distribusi keanggotaan dari seluruh istilah linguistik. Penelitian ini berkontribusi pada penerapan sistem IoT berbasis logika fuzzy untuk kontrol pakan otomatis pada budidaya lobster air tawar, meningkatkan efisiensi pemberian pakan, mengurangi pemborosan, dan mendukung produktivitas yang berkelanjutan. Penelitian lanjutan disarankan untuk menambahkan parameter lain dan menggunakan machine learning untuk peramalan pertumbuhan serta mitigasi risiko kematian. Kata kunci: fuzzy logic, internet of things (IoT), kontrol pakan otomatis, cherax quadricarinatus, analisis sensitivitas
Deteksi Kesegaran Ikan Berdasarkan Mata dan Insang Menggunakan Model YOLOv8
This research presents an experimental fish freshness detection system utilizing the YOLOv8 model for automaticassessment of fish quality based on visual indicators, specifically the clarity of eyes and the condition of gills. Fishfreshness assessment is critical in the seafood industry, especially for export markets where international safetystandards apply. Traditional methods such as organoleptic tests are often subjective and inefficient, highlightingthe need for scalable, automated solutions. This study leverages computer vision and transfer learning, usingYOLOv8 pretrained on COCO weights, and analyzes a dataset of 3,916 high-resolution images expanded to 4,600through strategic data augmentation and perfect class balancing. Four freshness classes—fresh eyes, non-fresheyes, fresh gills, and non-fresh gills—are evenly represented. The dataset was resized to 640×640 pixels and splitinto 3,200 training, 800 validation, and 600 testing images. The YOLOv8 model achieved 99.83% detectionaccuracy and a [email protected] of 0.995 after 20 training epochs under controlled conditions. Confusion matrixanalysis revealed near-perfect classification across all categories. A comparative experiment using EfficientDetdemonstrated YOLOv8’s superior performance with a 24.43% accuracy improvement. These results validate theeffectiveness and robustness of the approach for real-world deployment. The study provides a scalable foundationfor implementing computer vision-based seafood quality control systems, with strong potential to enhance foodsafety, operational efficiency, and consumer trust in the seafood supply chain.Penelitian ini menyajikan sistem eksperimental deteksi kesegaran ikan menggunakan model YOLOv8 untuk penilaian otomatis kualitas ikan berdasarkan indikator visual seperti kejernihan mata dan insang. Penilaian kesegaran ikan sangat penting dalam industri perikanan untuk memastikan keamanan dan kualitas produk, terutama bagi negara pengekspor dengan standar internasional yang ketat. Metode tradisional seperti uji organoleptik bersifat subjektif dan tidak efisien untuk aplikasi skala besar, sehingga mendorong kebutuhan akan solusi otomatis. Dengan menggunakan teknik computer vision, studi eksperimental ini menganalisis dataset yang berasal dari 3.916 gambar ikan beresolusi tinggi (3024×4032 piksel) yang dikumpulkan dan dianotasi dengan cermat, kemudian diperbesar menjadi 4.600 gambar melalui teknik augmentasi data dan penyeimbangan untuk merepresentasikan empat kelas kesegaran secara merata. Metodologi penelitian mencakup teknik augmentasi dengan transformasi geometris yang diterapkan secara selektif untuk mencapai distribusi seimbang antara mata segar, mata tidak segar, insang segar, dan insang tidak segar, dengan dataset akhir terdiri dari 3.200 gambar training, 800 gambar validasi, dan 600 gambar testing yang di-resize menjadi 640×640 piksel untuk optimisasi YOLOv8.. Model YOLOv8 dilatih dan dievaluasi dalam kondisi eksperimental terkontrol, mencapai metrik akurasi yang mengesankan yaitu 99,83% untuk deteksi dengan [email protected] sebesar 0,995 setelah 20 epoch. Temuan ini menyoroti potensi luar biasa model dalam deteksi objek otomatis, menunjukkan hasil yang menjanjikan untuk implementasi masa depan dalam identifikasi kesegaran ikan yang cepat dan tepat. Pendekatan eksperimental ini tidak hanya mendemonstrasikan kelayakan deteksi kesegaran ikan otomatis tetapi juga memberikan fondasi untuk pengembangan masa depan aplikasi praktis dalam praktik keamanan pangan industri makanan laut, menunjukkan potensi transfer learning dalam aplikasi computer vision khusus
Hybrid TF-IDF and Embedding Model for Improving Similarity and Clustering Accuracy
This study addresses improving accuracy in final project document recommendation systems for students by employing ahybrid approach that combines the vector-based TF-IDF method with semantic embedding models SBERT and E5. Theprimary issue tackled is the limitation of TF-IDF in capturing semantic context, often resulting in recommendations that areless relevant in meaning. This research aims to develop a recommendation system that considers literal word similarity andsemantic similarity between documents. The Research utilizes 500 metadata records of student theses from an institutionalrepository via the OAI-PMH protocol, focusing on key attributes such as title, abstract, and keywords. The data undergoes atext preprocessing phase, which includes tokenization, normalization, stopword removal, and stemming. Three similarityapproaches are applied: TF-IDF, SBERT, and E5, each used to calculate document similarity. Evaluation compares similarityscores, analyzes ranking shifts, score distributions, and document clustering using the K-Means algorithm. Experimentalresults show that the hybrid model significantly improves recommendation quality. The E5 model produces the most stableand semantically relevant similarity scores and the cleanest and most visually distinct document clusters. Both Spearman andPearson correlation analyses indicate that combining TF-IDF with embedding models improves the ranking order ofrecommended documents. In conclusion, the hybrid approach using TF-IDF and semantic embeddings, particularly E5,significantly enhances the accuracy of document recommendation systems and the effectiveness of topic clusterin