Kimi K2.7-Code Dari Moonshot AI Tercatat Naik 21,8% di Kimi Code Bench

Daily Akamuga – Perusahaan Moonshot AI baru-baru ini meluncurkan model baru bernama Kimi K2.7-Code, yang merupakan model agen pemrograman yang difokuskan pada pengembangan perangkat lunak jangka panjang. Model ini dirancang untuk menjalankan berbagai tugas, termasuk perencanaan, pengeditan, penggunaan alat, dan debugging, yang memungkinkan pengembang untuk merampungkan pekerjaan mereka lebih efisien di berbagai tahapan.

Table of Contents

Kimi K2.7-Code

Kimi K2.7-Code merupakan model Mixture-of-Experts (MoE) yang memiliki total satu triliun parameter, dengan kemampuan mengaktifkan 32 miliar parameter untuk setiap token. Desain model ini terdiri dari 384 ahli, memilih delapan ahli per token, dan satu ahli bersama. Model ini juga dilengkapi dengan 61 lapisan, termasuk satu lapisan dense. Kimi K2.7-Code menggunakan arsitektur Attention Layer dengan Multi-Head Attention (MLA) serta menggunakan jalur feed-forward menggunakan SwiGLU.

Kimi K2.7-Code juga mendukung pemrosesan input gambar dan video berkat penambahan encoder visi MoonViT yang menambah 400 juta parameter. Model ini memungkinkan konteks hingga 256.000 token, menjadikannya sangat kuat dalam menangani masukan yang besar. Dukungan untuk kuantisasi INT4 juga menjadi keunggulan lainnya.

Benchmark

Tim Moonshot telah merilis enam pengujian benchmark yang menunjukkan bahwa K2.7-Code mengungguli pendahulunya K2.6 dan beberapa model terkenal lainnya seperti GPT-5.5 dan Claude Opus 4.8. K2.7-Code menunjukkan lonjakan terbesar dalam pengujian Kimi Code Bench v2, di mana skor meningkat dari 50,9 menjadi 62,0. Pengujian lainnya juga menunjukkan peningkatan kualitas dalam hasil pemrograman.

Namun, perlu dicatat bahwa semua data benchmark tersebut merupakan hasil pengujian internal dan independen masih diperlukan untuk memverifikasi klaim tersebut.

Kemanjuran Token Reasoning

Dalam laporan yang disampaikan, tim Moonshot mengklaim bahwa K2.7-Code menggunakan sekitar 30% lebih sedikit token reasoning dibandingkan dengan model sebelumnya. Ini dianggap sebagai efisiensi yang signifikan karena mengurangi biaya setiap tugas. Hal ini memungkinkan pengguna untuk menyelesaikan lebih banyak langkah dengan biaya yang lebih rendah dalam sesi interaktif CLI (Command Line Interface).

Penghematan biaya ini berdampak pada tiga area utama: pengurangan biaya token output per tugas, langkah yang lebih cepat yang menguntungkan sesi interaktif, dan lebih banyak langkah sebelum mencapai batas konteks.

Contoh Penggunaan

Kimi K2.7-Code dirancang untuk beberapa kasus penggunaan utama. Salah satunya adalah refaktor skala repositori, di mana model dapat dipandu untuk mengatasi pengujian yang gagal dengan cara membaca file, melakukan pengeditan, dan menjalankan kembali pengujian. Ini juga dapat digunakan dalam ulasan kode, di mana pengguna dapat memberikan perbedaan permintaan tarik untuk analisis risiko.

Model ini juga dapat mengatasi alur kerja penggunaan alat MCP yang bisa menguji pemanggilan alat yang benar melalui protokol konteks model, mendukung pengujian sistem dan pembaruan tiket dalam satu proses.

Kesimpulan

Kimi K2.7-Code dari Moonshot AI menawarkan teknologi yang revolusioner dalam pengembangan perangkat lunak. Dengan kemampuan tingkat tinggi dalam pemrograman dan efisiensi token reasoning yang lebih baik, model ini diharapkan dapat membantu pengembang untuk menyelesaikan tugas mereka dengan lebih efektif. Meskipun terdapat beberapa kelemahan, seperti pengujian yang dilakukan secara internal, potensi model ini untuk memfasilitasi otomatisasi dan peningkatan produktivitas dalam pemrograman sangat layak untuk diperhatikan oleh berbagai kalangan di industri teknologi.

M	T	W	T	F	S	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Kimi K2.7-Code

Benchmark

Kemanjuran Token Reasoning

Contoh Penggunaan

Kesimpulan

Related Posts