Kimi K2.5 Open Source: Lisensi, Bobot Model & Panduan Self-Hosting 2026

Feb 10, 2026

New to Kimi K2.5?Try Kimi K2.5.

Rilis Kimi K2.5 open source menandai tonggak penting dalam mendemokratisasi akses ke AI mutakhir. Berbeda dengan model proprietary dari OpenAI dan Anthropic, Moonshot AI merilis Kimi K2.5 dengan open weights di bawah Modified MIT License, sehingga peneliti, developer, dan perusahaan dapat menjalankan, memodifikasi, serta men-deploy model sesuai ketentuan mereka sendiri.

Gambaran Umum Kimi K2.5 Open Source

Apa Arti "Open Source" untuk Kimi K2.5?

Kimi K2.5 dirilis sebagai model open-weights, yang berarti:

  • ✅ Bobot model dapat diunduh secara publik
  • ✅ Dapat dijalankan secara lokal atau di infrastruktur privat
  • ✅ Fine-tuning dan modifikasi diperbolehkan
  • ✅ Penggunaan komersial diizinkan (dengan batasan)
  • ✅ Tidak memerlukan ketergantungan pada API
  • ❌ Data pelatihan tidak publik
  • ❌ Kode pelatihan lengkap tidak dirilis

Perbandingan dengan Model "Open" Lainnya

ModelOpen WeightsData PelatihanPenggunaan KomersialBenar-benar Open Source
Kimi K2.5✅ Ya❌ Tidak✅ Modified MIT⚠️ Sebagian
Llama 3.1✅ Ya❌ Tidak✅ Ya (dengan batasan)⚠️ Sebagian
Mistral✅ Ya❌ Tidak✅ Ya⚠️ Sebagian
GPT-4❌ Tidak❌ Tidak❌ Hanya API❌ Tidak
Claude❌ Tidak❌ Tidak❌ Hanya API❌ Tidak

Penjelasan Modified MIT License Kimi K2.5

Gambaran Umum Lisensi

Modified MIT License mengizinkan penggunaan yang luas sekaligus menyertakan beberapa batasan untuk deployment komersial bervolume tinggi.

Apa yang BOLEH Anda Lakukan

IzinDetail
PenggunaanPenggunaan personal, akademik, dan komersial
ModifikasiFine-tune dan adaptasi model
DistribusiMembagikan modifikasi dan turunannya
Penggunaan PrivatDeploy di infrastruktur privat
SublicenseMenyertakan dalam proyek yang lebih besar

Apa yang TIDAK BOLEH Anda Lakukan (Batasan)

BatasanAmbang BatasDetail
Kewajiban Atribusi>100 juta MAU atau >$20 juta pendapatan bulananWajib menampilkan "Kimi K2.5" secara mencolok pada produk/layanan yang dihadapi pengguna
Penggunaan BerbahayaApa punSenjata, pengawasan, dll.

Teks Lisensi Lengkap

Lisensi lengkap tersedia di: https://huggingface.co/moonshotai/Kimi-K2.5/blob/main/LICENSE

Klausul utama:

Permission is hereby granted, free of charge, to any person obtaining a copy
of this model and associated documentation files (the "Model"), to deal
in the Model without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Model, subject to the following conditions:

1. If your product/service exceeds 100 million monthly active users
   or $20 million in monthly revenue, you must prominently display "Kimi K2.5"
   in all user-facing products/services.

2. Standard MIT-style notice obligations still apply.

Mengunduh Bobot Kimi K2.5

Saluran Distribusi Resmi

SumberURLFormat
HuggingFacehuggingface.co/moonshotai/Kimi-K2.5PyTorch / Safetensors
Model Scopemodelscope.cn/models/MoonshotAI/Kimi-K2.5PyTorch

Metode Pengunduhan

Menggunakan HuggingFace Hub

from huggingface_hub import snapshot_download

# Download complete model
model_path = snapshot_download(
    repo_id="moonshotai/Kimi-K2.5",
    local_dir="./kimi-k2-5",
    local_dir_use_symlinks=False,
    resume_download=True
)

Menggunakan Git LFS

# Install Git LFS
git lfs install

# Clone repository
git clone https://huggingface.co/moonshotai/Kimi-K2.5.git

# Or sparse checkout for specific files
git clone --filter=blob:none https://huggingface.co/moonshotai/Kimi-K2.5.git

Menggunakan wget/curl

# Download specific files
wget https://huggingface.co/moonshotai/Kimi-K2.5/resolve/main/config.json
wget https://huggingface.co/moonshotai/Kimi-K2.5/resolve/main/model.safetensors.index.json

Struktur File Model

kimi-k2-5/
├── config.json              # Model configuration
├── tokenizer.json           # Tokenizer vocab
├── tokenizer_config.json    # Tokenizer settings
├── model.safetensors.index.json  # Weight index
├── model-00001-of-000064.safetensors  # Shard 1
├── model-00002-of-000064.safetensors  # Shard 2
├── ...
├── model-00064-of-000064.safetensors  # Shard 64
├── generation_config.json   # Generation defaults
└── LICENSE                  # License file

Self-Hosting Kimi K2.5

Kebutuhan Perangkat Keras

Panduan deployment resmi Moonshot tidak mempublikasikan satu spesifikasi perangkat keras "minimum" yang baku. Panduan tersebut menyediakan konfigurasi referensi:

SkenarioContoh resmiCatatan
Inferensi vLLM / SGLangSingle-node H200 dengan tensor parallel size 8Perintah referensi dari panduan deployment Moonshot
Inferensi KTransformers + SGLang8x NVIDIA L20 + 2x Intel 6454SContoh inferensi heterogen CPU+GPU
LoRA SFT dengan KTransformers + LLaMA-Factory2x RTX 4090 + Intel 8488C (dengan RAM/swap besar)Contoh fine-tuning dari panduan

Opsi Deployment

1. Deployment Lokal dengan Transformers

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Load model
model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",  # Local path
    torch_dtype=torch.float16,
    device_map="auto",
    trust_remote_code=True
)

tokenizer = AutoTokenizer.from_pretrained(
    "./kimi-k2-5",
    trust_remote_code=True
)

# Inference
inputs = tokenizer("Hello, Kimi!", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))

2. Deployment Produksi dengan vLLM

# Install vLLM
uv pip install -U vllm --torch-backend=auto --extra-index-url https://wheels.vllm.ai/nightly

# Start server
vllm serve ./kimi-k2-5 \
    -tp 8 \
    --mm-encoder-tp-mode data \
    --trust-remote-code \
    --tool-call-parser kimi_k2 \
    --reasoning-parser kimi_k2

3. Deployment Docker

FROM nvidia/cuda:12.1-devel-ubuntu22.04

WORKDIR /app

# Install dependencies
RUN pip install torch vllm transformers

# Copy model (or mount as volume)
COPY ./kimi-k2-5 /models/kimi-k2-5

# Expose port
EXPOSE 8000

# Start server
CMD python -m vllm.entrypoints.openai.api_server \
    --model /models/kimi-k2-5 \
    --tensor-parallel-size 4 \
    --host 0.0.0.0 \
    --port 8000
# Build and run
docker build -t kimi-k2-5 .
docker run --gpus all -p 8000:8000 kimi-k2-5

4. Deployment Kubernetes

apiVersion: apps/v1
kind: Deployment
metadata:
  name: kimi-k2-5
spec:
  replicas: 1
  selector:
    matchLabels:
      app: kimi-k2-5
  template:
    metadata:
      labels:
        app: kimi-k2-5
    spec:
      containers:
      - name: vllm
        image: vllm/vllm-openai:latest
        args:
        - --model
        - /models/kimi-k2-5
        - --tensor-parallel-size
        - "4"
        volumeMounts:
        - name: model
          mountPath: /models
        resources:
          limits:
            nvidia.com/gpu: "4"
      volumes:
      - name: model
        persistentVolumeClaim:
          claimName: kimi-model-pvc

Opsi Deployment Cloud

AWS

# Using Deep Learning AMI
aws ec2 run-instances \
    --image-id ami-xxx \
    --instance-type p4d.24xlarge \
    --key-name my-key

# Deploy with ECS/EKS
# Use GPU-optimized instances (p4d, p5)

Google Cloud Platform

# Using Deep Learning VM
gcloud compute instances create kimi-server \
    --zone=us-central1-a \
    --machine-type=a2-highgpu-4g \
    --image-family=pytorch-latest-gpu

Azure

# Using NC-series VMs
az vm create \
    --resource-group myRG \
    --name kimi-vm \
    --size Standard_NC24ads_A100_v4

Fine-Tuning Kimi K2.5 Open Source

Fine-Tuning LoRA

from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments
from peft import LoraConfig, get_peft_model
import torch

# Load base model
model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    torch_dtype=torch.float16,
    device_map="auto",
    trust_remote_code=True
)

# Configure LoRA
lora_config = LoraConfig(
    r=16,
    lora_alpha=32,
    target_modules=["q_proj", "v_proj"],
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM"
)

# Apply LoRA
model = get_peft_model(model, lora_config)

# Training configuration
training_args = TrainingArguments(
    output_dir="./kimi-k2-5-finetuned",
    num_train_epochs=3,
    per_device_train_batch_size=1,
    gradient_accumulation_steps=4,
    learning_rate=2e-4,
    fp16=True,
    save_steps=100
)

# Train
from trl import SFTTrainer
trainer = SFTTrainer(
    model=model,
    args=training_args,
    train_dataset=dataset,
    tokenizer=tokenizer
)
trainer.train()

Full Fine-Tuning (membutuhkan sumber daya signifikan)

# For full fine-tuning, use DeepSpeed or FSDP
from accelerate import Accelerator

accelerator = Accelerator(deepspeed_plugin=deepspeed_plugin)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    trust_remote_code=True
)

# DeepSpeed config for distributed training
# Requires 8x H100 or equivalent

Kuantisasi untuk Deployment dengan Sumber Daya Terbatas

Kuantisasi 8-bit

from transformers import AutoModelForCausalLM, BitsAndBytesConfig
import torch

bnb_config = BitsAndBytesConfig(
    load_in_8bit=True,
    bnb_8bit_compute_dtype=torch.float16
)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True
)

Kuantisasi 4-bit

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True
)

Format GGUF (llama.cpp)

File GGUF hasil konversi komunitas tersedia, tetapi bukan rilis resmi Moonshot:

# Example community repo
# https://huggingface.co/unsloth/Kimi-K2.5-GGUF

# Inspect available files/tags in the chosen repo before running llama.cpp

Komunitas Open Source

Berkontribusi

Meskipun bobot model dasar bersifat tetap, kontribusi komunitas mencakup:

  • Varian fine-tuned: Adaptasi spesifik domain
  • Versi terkuantisasi: Dioptimalkan untuk perangkat keras yang berbeda
  • Library integrasi: SDK untuk berbagai framework
  • Tool deployment: Chart Kubernetes, image Docker

Proyek Komunitas Populer

ProyekDeskripsiTautan
MoonshotAI/Kimi-K2.5Repositori kode resmigithub.com/MoonshotAI/Kimi-K2.5
moonshotai/Kimi-K2.5 (HF)Kartu model open-weights resmi beserta filehuggingface.co/moonshotai/Kimi-K2.5
unsloth/Kimi-K2.5-GGUFContoh konversi GGUF komunitashuggingface.co/unsloth/Kimi-K2.5-GGUF
KTransformers docsReferensi deployment dan tuning K2.5github.com/kvcache-ai/ktransformers

Kepatuhan dan Praktik Terbaik

Checklist Kepatuhan Lisensi

  • Tinjau Modified MIT License secara menyeluruh
  • Periksa jumlah pengguna jika menawarkan layanan publik
  • Tinjau ketentuan API terpisah sebelum menjual kembali akses hosted
  • Sertakan lisensi dalam distribusi
  • Berikan atribusi yang sesuai kepada Moonshot AI

Pertimbangan Keamanan

# Implement input validation
def validate_input(text):
    max_length = 100000  # Limit input size
    if len(text) > max_length:
        raise ValueError("Input too long")
    
    # Block harmful prompts
    blocked_terms = ["..."]  # Your list
    for term in blocked_terms:
        if term in text.lower():
            raise ValueError("Blocked content detected")
    
    return text

Pemantauan dan Logging

import logging

logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

def generate_with_logging(prompt):
    logger.info(f"Generation request: {len(prompt)} chars")
    
    output = model.generate(**inputs)
    
    logger.info(f"Generated: {len(output)} tokens")
    return output

FAQ

Apakah Kimi K2.5 benar-benar open source?

Kimi K2.5 adalah open weights di bawah Modified MIT License. Ini memberikan kebebasan signifikan dibandingkan model closed yang hanya tersedia via API, meskipun tidak menyertakan data pelatihan atau kode pelatihan lengkap (yang merupakan hal lazim untuk model AI besar).

Bisakah saya menggunakan Kimi K2.5 secara komersial?

Ya, dengan ketentuan. Modified MIT License mengizinkan penggunaan komersial untuk sebagian besar bisnis. Jika produk/layanan Anda melampaui 100 juta MAU atau $20 juta pendapatan bulanan, Anda wajib menampilkan "Kimi K2.5" secara mencolok pada antarmuka yang dihadapi pengguna.

Berapa biaya self-hosting?

Biaya sangat bervariasi tergantung wilayah, penyedia cloud, strategi kuantisasi, dan target throughput. Gunakan kalkulator cloud terkini serta contoh dari panduan deployment resmi sebagai dasar saat menyusun anggaran.

Bisakah saya memodifikasi dan mendistribusikan ulang Kimi K2.5?

Ya, Anda dapat memodifikasi, fine-tune, dan mendistribusikan versi modifikasi Anda di bawah ketentuan lisensi yang sama. Ini termasuk membuat model turunan.

Bagaimana perbandingan Kimi K2.5 dengan Llama 3 untuk penggunaan open source?

AspekKimi K2.5Llama 3 / 3.1
ParameterTotal 1T / aktif 32BBervariasi per checkpoint
Konteks256KBervariasi per versi (hingga 128K pada Llama 3.1)
LisensiModified MITLlama Community License
KomersialDiizinkan dengan klausul ambang atribusiDiizinkan dengan batasan spesifik lisensi
Perangkat KerasUmumnya berat pada kualitas penuhSering lebih ringan untuk checkpoint yang lebih kecil

Referensi

Kimi K2.5 Open Source: Lisensi, Bobot Model & Panduan Self-Hosting 2026