Jurnal Kecerdasan Buatan dan Teknologi Informasi
Not a member yet
    61 research outputs found

    BERT SENTIMENT ANALYSIS FOR DETECTING FRAUDULENT MESSAGES

    No full text
    With the increasing prevalence of digital communication, fraudulent SMS messages have become a growing concern. This study employs a BERT-based sentiment approach to classify SMS messages into four categories: fraud, gambling, Unsecured Credit (KTA – Kredit Tanpa Agunan), and others. These categories were determined based on content analysis and common patterns found in high-risk messages, such as suspicious transaction invitations (fraud), betting promotions (gambling), offers for unsecured loans (KTA), and other messages that do not fall into the three main categories. The dataset used consists of approximately 20,000 message records, which underwent data cleaning, tokenization, and manual labeling based on the aforementioned criteria. The model was trained using the AdamW optimizer with CrossEntropyLoss as the loss function for multi-class classification. Training was conducted over 3 epochs, a number chosen based on observations of evaluation metrics on the validation data, which showed that model accuracy began to plateau after the third epoch, while overfitting started to occur in subsequent epochs. After training, the model achieved an average accuracy of 92%. This result indicates that the BERT model is effective in understanding patterns in text messages and capable of classifying message categories with a high level of accuracy. These findings support the application of BERT technology in the efficient detection and identification of fraudulent messages

    MACHINE LEARNING-BASED CLASSIFICATION OF SPACE TRAVEL ELIGIBILITY USING SUPPORT VECTOR MACHINE, RANDOM FOREST, AND XGBOOST

    No full text
    This study applies machine learning classification techniques to predict passenger displacement events based on corrupted data retrieved from a hypothetical interstellar spacecraft mission. Using a cleaned and preprocessed dataset containing demographic, behavioral, and exposure-related features, we compare the performance of three classification models: Random Forest, Support Vector Machine (SVM), and XGBoost. Each model is trained on 80% of the data and evaluated on the remaining 20% using precision, recall, f1-score, and accuracy metrics. The SVM model shows the most notable improvement after feature selection, achieving a balanced performance across metrics. Meanwhile, Random Forest and XGBoost models maintain consistent and robust accuracy above 80% on both training and testing sets. Feature importance analysis also supports the interpretability of the models, particularly in Random Forest and XGBoost. The comparative analysis demonstrates that ensemble-based methods such as Random Forest and XGBoost are more effective in handling the complexity of the dataset, making them suitable for predictive tasks in high-dimensional, partially incomplete data scenarios

    ALGORITMA REGRESI LINIER SEDERHANA UNTUK PREDIKSI PENGGUNAAN VOLUME AIR BERDASARKAN JENIS PELANGGAN PDAM

    No full text
    Penelitian ini bertujuan untuk memprediksi penggunaan volume air oleh pelanggan PDAM Kabupaten Cirebon berdasarkan jenis pelanggan menggunakan algoritma regresi linier sederhana. Sumber daya air merupakan aset penting dalam kehidupan sehari-hari, dan pemahaman mendalam tentang pola penggunaan air dari berbagai jenis pelanggan diperlukan untuk meningkatkan efisiensi pengelolaan dan keberlanjutan layanan. Pada tahun 2021, konsumsi air pelanggan mencapai 6.850.831 m3, dan tahun 2022 sebesar 6.920.429 m3. Penelitian ini menggunakan data penggunaan air dari kategori pelanggan seperti rukun tetangga, niaga, industri, sosial, keran umum, dan instansi pemerintah. Data dianalisis dengan regresi linier sederhana untuk mengeksplorasi hubungan antara jenis pelanggan dan volume air yang digunakan. Metodologi penelitian mencakup pengumpulan data, analisis, pengujian hipotesis, pengolahan informasi, dan evaluasi model untuk memastikan akurasi prediksi. Hasil penelitian diharapkan memberikan wawasan bagi PDAM Kabupaten Cirebon dalam merencanakan kebutuhan air, mengoptimalkan distribusi, dan meningkatkan kualitas layanan. Selain itu, penelitian ini diharapkan menjadi referensi untuk penelitian lebih lanjut mengenai manajemen sumber daya air di daerah lain dan berkontribusi pada pengembangan kebijakan pengelolaan air bersih yang lebih baik

    SISTEM PENDUKUNG KEPUTUSAN DALAM MENENTUKAN PERINGKAT UNIVERSITAS SWASTA DI SUMATERA UTARA MENGGUNAKAN METODE TOPSIS

    No full text
    Universitas merupakan pendidikan perguruan tinggi yang memiliki beberapa fakultas dalam sejumlah disiplin ilmu tertentu. Banyaknya universitas swasta dalam program studi berbasis komputer, membuat calon mahasiswa kesulitan dalam memilih agar nantinya dapat menjadi lulusan yang terbaik. Oleh karena itu dalam penelitian ini akan ditentukan peringkat Universitas Swasta dengan menggunakan metode sistem pendukung keputusan TOPSIS. Sistem pendukung keputusan adalah salah satu teknik yang digunakan untuk menentukan peringkat Universitas swasta dengan rumpun ilmu teknologi informasi di Sumatera Utara khususnya di Kota Medan berbasis web. Dalam penelitian ini menggunakan 10 data universitas dan 6 variabel kriteria yaitu akreditas program studi, ratio dosen, fasilitas, reputasi, bangunan, dan biaya kuliah. Dalam metode TOPSIS data alternating akan diubah menjadi matrik keputusan ternormalisasi dan terbobot, kemudian data tersebut akan dilakukan penentuan matriks solusi ideal positif dan negatif, selanjutnya dilakukan penentan jarak antara nilai alternatif matriks solusi ideal positif dan negatif, dan terakhir akan terdapat nilai preferensi untuk setiap alternatif. Hasil dari penelitian dengan menggunakan data sampel sebanyak 10 universitas dapat disimpulkan bahwa sistem pendukung keputusan  menggunakan metode TOPSIS dapat membantu dalam menentukan peringkat universitas swasta di Kota Medan. Metode ini memungkinkan manajemen universitas untuk membandingkan kriteria dan alternatif dengan berdasarkan nilai ideal positif dan nilai ideal negatif, dimana dalam pengujian sistem berbasis web dengan data alternatif Universitas Harapan Medan mendapat peringkat 3

    ANALISIS SENTIMEN PUBLIK DI MEDIA SOSIAL TERHADAP KENAIKAN PPN 12% DI INDONESIA MENGGUNAKAN INDOBERT

    No full text
    Penelitian ini menganalisis sentimen publik terkait rencana kenaikan Pajak Pertambahan Nilai (PPN) 12% di Indonesia menggunakan model transformer berbasis Bahasa Indonesia, IndoBERT. Dengan mengumpulkan 2.581 sampel data dari platform media sosial X, Instagram, dan TikTok, penelitian ini BERTujuan untuk memahami respons publik secara mendalam. Data melalui tahapan pra-pemrosesan, tokenisasi, dan label mapping sebelum dibagi 80/10/10 menjadi set pelatihan, validasi, dan pengujian. Model IndoBERT dasar yang di-fine-tuned selama tiga epoch menunjukkan kinerja yang signifikan pada set pengujian. Secara kuantitatif, model mencapai accuracy 84,94%, precision 85,60%, recall 84,94%, dan F1-score (weighted) 84,37%. Analisis distribusi sentimen lebih lanjut menunjukkan bahwa sentimen publik yang dominan adalah negatif. Tingginya nilai metrik evaluasi ini menegaskan efektivitas IndoBERT untuk tugas klasifikasi sentimen berbahasa Indonesia pada data media sosial. Kesimpulannya, temuan ini tidak hanya menunjukkan kapabilitas model, tetapi juga memberikan dasar analisis yang kuat mengenai tingkat penerimaan atau penolakan publik terhadap kebijakan kenaikan PPN 12%, menawarkan nilai tambah bagi pemahaman dampak kebijakan publik

    PERBANDINGAN ALGORITMA NAZIEF-ADRIANI DAN PORTER UNTUK PERINGKASAN TEKS OTOMATIS DENGAN LATENT SEMANTIC ANALYSIS PADA MODUL PEMBELAJARAN BERBAHASA INDONESIA

    No full text
    Penelitian ini mengembangkan sistem peringkasan teks otomatis untuk modul pembelajaran berbahasa Indonesia menggunakan metode Latent Semantic Analysis. Tantangan utama peringkasan teks dalam Bahasa Indonesia mencakup kompleksitas struktur bahasa dan penggunaan imbuhan, yang memerlukan proses prapemrosesan teks secara menyeluruh, termasuk stemming. Penelitian ini membandingkan dua algoritma stemming, yaitu Nazief-Adriani dan Porter, untuk mengubah kata berimbuhan menjadi bentuk dasar. Metode ini diawali dengan pemecahan kalimat, pembersihan teks, penghapusan kata tidak penting, dan pembobotan kata menggunakan Term Frequency-Inverse Document Frequency. Tahap selanjutnya adalah analisis hubungan semantik antar kata dan kalimat menggunakan Singular Value Decomposition untuk menghasilkan matriks term-dokumen yang diproses menjadi salience score. Hasil evaluasi menunjukkan bahwa algoritma Nazief-Adriani memiliki akurasi lebih tinggi dengan nilai precision, recall, dan F-measure masing-masing sebesar 87,69%, 83,41%, dan 85,37%, dibandingkan Porter yang hanya mencapai rata-rata 81,50%. Algoritma Latent Semantic Analysis memberikan tingkat akurasi rata-rata sebesar 83,49%, lebih unggul dibandingkan penelitian sebelumnya. Kesimpulan penelitian ini menegaskan efektivitas metode Latent Semantic Analysis untuk peringkasan teks otomatis dan superioritas algoritma Nazief-Adriani dalam menghasilkan akurasi yang lebih baik dan merekomendasikan pengembangan sistem yang lebih efisien dan mendukung pemrosesan Bahasa Indonesia secara optimal

    SISTEM INFORMASI GEOGRAFIS TEMPAT WISATA DAN CAGAR BUDAYA BERBASIS WEB DI KABUPATEN LIMA PULUH KOTA

    No full text
    Dinas Kebudayaan dan Pariwisata merupakan salah satu dinas yang bergerak dalam bidang pariwisata dan kebudayaan. Kabupaten Lima Puluh Kota memiliki berbagai macam tempat wisata dan cagar budaya yang layak untuk di kunjungi wisatawan. Seperti, Lembah Harau, Perternakan Sapi Padang Mangateh, Perkebunan Jeruk, Talempong Batu, Menhir Bawah Parit, dan lain-lain. Masalah yang terjadi saat ini, masyarakat kurang mengetahui sebaran tempat wisata dan cagar budaya yang ada di Kabupaten Lima Puluh Kota. Masih minimnya informasi tentang lokasi-lokasi wisata dan cagar budaya di kabupaten lima puluh kota, menimbulkan beberapa masalah untuk para wisatawan yang ingin berkunjung ketempat tersebut. Penelitian ini bertujuan untuk meminimalisir permasalahan yang terjadi. Aplikasi ini dibangun dengan menggunakan bahasa pemograman PHP, metode penelitian menggunakan metode SDLC dengan model Waterfall. Alat bantu yang digunakan Unified Modeling Language (UML). Solusi yang di tawarkan yaitu untuk merancang dan membangun sistem informasi geografis tempat wisata dan cagar budaya Kabupaten Lima Puluh Kota. Hasil yang diharapkan berupa Aplikasi sistem informasi geografis tempat wisata dan cagar budaya Kabupaten Lima Puluh Kota berbasis web yang dapat meminimalisir permasalahan dan mempermudah wisatawan untuk mendapatkan informasi tentang tempat dan lokasi wisata dan cagar budaya

    IMPLEMENTASI GRADIENT BOOSTING MACHINES UNTUK PREDIKSI HARGA RUMAH PADA JAKARTA SELATAN

    No full text
    Prediksi harga properti menjadi salah satu tantangan penting dalam bidang real estat, khususnya di wilayah perkotaan seperti Jakarta Selatan yang mengalami perkembangan pesat. Informasi mengenai estimasi harga rumah sangat dibutuhkan oleh pembeli, penjual, maupun investor untuk pengambilan keputusan yang lebih akurat. Penelitian ini bertujuan untuk membangun model prediksi harga rumah dengan menerapkan metode Gradient Boosting Machine (GBM), sebuah teknik machine learning yang menggabungkan sejumlah decision tree secara iteratif untuk meningkatkan akurasi prediksi. Dataset yang digunakan mencakup beberapa variabel penting, antara lain luas tanah, luas bangunan, jumlah kamar tidur, jumlah kamar mandi, dan garasi. Berdasarkan hasil pelatihan dan pengujian model, diketahui bahwa luas tanah dan luas bangunan memiliki pengaruh paling dominan terhadap harga rumah. Evaluasi performa model menunjukkan nilai mean squared error (MSE) sebesar 1.6e+19 dan mean absolute error (MAE) sekitar 30 miliar rupiah, yang menunjukkan masih adanya tingkat kesalahan prediksi yang signifikan, terutama pada rumah dengan harga sangat tinggi. Selain itu, analisis visual terhadap distribusi galat dan residual plot mengungkapkan adanya sejumlah outlier yang perlu diperhatikan. Oleh karena itu, diperlukan optimasi lanjutan pada model agar mampu menangkap pola data yang lebih kompleks dan menghasilkan prediksi yang lebih presisi

    OPTIMALISASI PRESTASI AKADEMIK SISWA MELALUI PENGELOMPOKAN INDEKS PRESTASI DENGAN K-MEANS CLUSTERING

    No full text
    Prestasi akademik merupakan indikator penting dalam menilai kemampuan dan perkembangan siswa selama proses pembelajaran. Namun, banyak lembaga pendidikan yang masih menghadapi tantangan dalam mengidentifikasi kelompok siswa berdasarkan performa akademik secara efisien, sehingga intervensi pembelajaran yang tepat sulit dilakukan. Penelitian ini bertujuan untuk mengoptimalkan prestasi akademik siswa melalui pengelompokan indeks prestasi dengan metode K-Means Clustering. Metode K-Means digunakan karena kemampuannya dalam mengelompokkan data ke dalam beberapa klaster homogen berdasarkan kesamaan nilai. Data yang digunakan berupa indeks prestasi siswa dari beberapa semester. Proses pengelompokan dilakukan dengan menetapkan sejumlah klaster awal, kemudian dilakukan iterasi untuk mengoptimalkan posisi centroid hingga mencapai konvergensi. Hasil penelitian menunjukkan bahwa siswa dapat dikelompokkan ke dalam tiga kategori utama, yaitu siswa dengan prestasi tinggi, sedang, dan rendah. Pengelompokan ini memberikan gambaran yang lebih jelas kepada pihak sekolah dalam menyusun strategi pembinaan dan pemberian program khusus yang sesuai dengan kebutuhan masing-masing kelompok siswa. Dengan penerapan K-Means Clustering, institusi pendidikan dapat melakukan pemantauan dan evaluasi akademik secara lebih terstruktur serta memberikan intervensi yang lebih tepat sasaran. Penelitian ini menyimpulkan bahwa teknik pengelompokan data dapat menjadi solusi inovatif dalam mendukung peningkatan mutu pendidikan melalui pendekatan berbasis data

    IMPLEMENTASI ALGORITMA DECISION TREE PADA KINERJA KARYAWAN MENGGUNAKAN KERANGKA OBJECTIVE AND KEY RESULT (OKR)

    No full text
    OKR (Objectives and Key Results) adalah kerangka kerja yang digunakan untuk menetapkan dan memantau tujuan serta hasil kunci yang diinginkan oleh sebuah organisasi. Penilaian dilakukan secara berkala untuk mengevaluasi kemajuan dan mengukur efektivitas OKR dalam mencapai tujuan yang telah ditetapkan. Dalam penelitian ini, data sintetis digunakan untuk memprediksi kinerja karyawan. Data sintetis dihasilkan menggunakan metode faker yang terdapat dalam library Python, dengan referensi data asli sebagai acuan. Machine learning, sebagai bagian dari kecerdasan buatan, memungkinkan sistem untuk belajar secara otomatis dan meningkatkan kemampuannya berdasarkan pengalaman tanpa perlu diprogram secara eksplisit. Algoritma Decision Tree digunakan dalam penelitian ini untuk klasifikasi dan regresi. Penelitian ini bertujuan untuk memprediksi hasil kinerja karyawan dengan label "cukup", "baik", "memuaskan", dan "sangat memuaskan". Hasil penelitian menunjukkan bahwa algoritma Decision Tree dapat digunakan untuk membangun pohon keputusan yang efektif dalam memprediksi kategori kinerja karyawan. Kesimpulannya, algoritma Decision Tree mampu membuat pohon keputusan yang berguna dalam evaluasi kinerja karyawan

    0

    full texts

    61

    metadata records
    Updated in last 30 days.
    Jurnal Kecerdasan Buatan dan Teknologi Informasi
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇