Kimi K2.5 Açık Kaynak: Lisans, Model Ağırlıkları ve Self-Hosting Rehberi 2026

Şub 10, 2026

New to Kimi K2.5?Try Kimi K2.5.

Kimi K2.5 açık kaynak sürümü, son teknoloji yapay zekâya erişimi demokratikleştirme yolunda önemli bir kilometre taşını temsil ediyor. OpenAI ve Anthropic gibi şirketlerin tescilli (proprietary) modellerinin aksine, Moonshot AI Kimi K2.5'i Modified MIT License altında open weights olarak yayımladı; böylece araştırmacılar, geliştiriciler ve kurumlar modeli kendi koşullarına göre çalıştırabiliyor, değiştirebiliyor ve dağıtabiliyor.

Kimi K2.5 Açık Kaynak Genel Bakış

Kimi K2.5 İçin "Açık Kaynak" Ne Anlama Geliyor?

Kimi K2.5, bir open-weights modeli olarak yayımlanmıştır; bu da şu anlama gelir:

  • ✅ Model ağırlıkları herkese açık olarak indirilebilir
  • ✅ Yerel olarak veya özel altyapıda çalıştırılabilir
  • ✅ Fine-tuning ve modifikasyona izin verilir
  • ✅ Ticari kullanıma izin verilir (sınırlamalarla birlikte)
  • ✅ API bağımlılığı gerektirmez
  • ❌ Eğitim verisi herkese açık değildir
  • ❌ Eksiksiz eğitim kodu yayımlanmamıştır

Diğer "Açık" Modellerle Karşılaştırma

ModelOpen WeightsEğitim VerisiTicari KullanımGerçek Açık Kaynak
Kimi K2.5✅ Evet❌ Hayır✅ Modified MIT⚠️ Kısmen
Llama 3.1✅ Evet❌ Hayır✅ Evet (sınırlamalarla)⚠️ Kısmen
Mistral✅ Evet❌ Hayır✅ Evet⚠️ Kısmen
GPT-4❌ Hayır❌ Hayır❌ Yalnızca API❌ Hayır
Claude❌ Hayır❌ Hayır❌ Yalnızca API❌ Hayır

Kimi K2.5 Modified MIT License Açıklaması

Lisans Genel Bakışı

Modified MIT License, geniş kapsamlı kullanıma izin verirken yüksek hacimli ticari dağıtımlar için bazı kısıtlamalar içerir.

Yapabilecekleriniz

İzinAyrıntılar
KullanımKişisel, akademik ve ticari kullanım
DeğiştirmeModeli fine-tune etme ve uyarlama
DağıtımDeğişiklikleri ve türevleri paylaşma
Özel KullanımÖzel altyapıda dağıtım
SublicenseDaha büyük projelere dâhil etme

Yapamayacaklarınız (Kısıtlamalar)

KısıtlamaEşikAyrıntılar
Atıf Zorunluluğu>100M MAU veya >$20M aylık gelirKullanıcıya yönelik ürün/hizmetlerde "Kimi K2.5" ibaresini belirgin biçimde göstermeniz gerekir
Zararlı KullanımHerhangi biriSilah, gözetim vb.

Tam Lisans Metni

Lisansın tamamına şu adresten ulaşılabilir: https://huggingface.co/moonshotai/Kimi-K2.5/blob/main/LICENSE

Temel maddeler:

Permission is hereby granted, free of charge, to any person obtaining a copy
of this model and associated documentation files (the "Model"), to deal
in the Model without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Model, subject to the following conditions:

1. If your product/service exceeds 100 million monthly active users
   or $20 million in monthly revenue, you must prominently display "Kimi K2.5"
   in all user-facing products/services.

2. Standard MIT-style notice obligations still apply.

Kimi K2.5 Ağırlıklarını İndirme

Resmi Dağıtım Kanalları

KaynakURLFormat
HuggingFacehuggingface.co/moonshotai/Kimi-K2.5PyTorch / Safetensors
Model Scopemodelscope.cn/models/MoonshotAI/Kimi-K2.5PyTorch

İndirme Yöntemleri

HuggingFace Hub Kullanımı

from huggingface_hub import snapshot_download

# Download complete model
model_path = snapshot_download(
    repo_id="moonshotai/Kimi-K2.5",
    local_dir="./kimi-k2-5",
    local_dir_use_symlinks=False,
    resume_download=True
)

Git LFS Kullanımı

# Install Git LFS
git lfs install

# Clone repository
git clone https://huggingface.co/moonshotai/Kimi-K2.5.git

# Or sparse checkout for specific files
git clone --filter=blob:none https://huggingface.co/moonshotai/Kimi-K2.5.git

wget/curl Kullanımı

# Download specific files
wget https://huggingface.co/moonshotai/Kimi-K2.5/resolve/main/config.json
wget https://huggingface.co/moonshotai/Kimi-K2.5/resolve/main/model.safetensors.index.json

Model Dosyalarının Yapısı

kimi-k2-5/
├── config.json              # Model configuration
├── tokenizer.json           # Tokenizer vocab
├── tokenizer_config.json    # Tokenizer settings
├── model.safetensors.index.json  # Weight index
├── model-00001-of-000064.safetensors  # Shard 1
├── model-00002-of-000064.safetensors  # Shard 2
├── ...
├── model-00064-of-000064.safetensors  # Shard 64
├── generation_config.json   # Generation defaults
└── LICENSE                  # License file

Kimi K2.5 Self-Hosting

Donanım Gereksinimleri

Moonshot'un resmi dağıtım rehberi, tek ve sabit bir "minimum" donanım özelliği yayımlamaz. Bunun yerine referans yapılandırmalar sunar:

SenaryoResmi örnekNotlar
vLLM / SGLang çıkarımıTensor parallel size 8 ile tek düğümlü H200Moonshot dağıtım rehberinden referans komut
KTransformers + SGLang çıkarımı8x NVIDIA L20 + 2x Intel 6454SCPU+GPU heterojen çıkarım örneği
KTransformers + LLaMA-Factory ile LoRA SFT2x RTX 4090 + Intel 8488C (büyük RAM/swap ile)Rehberden fine-tuning örneği

Dağıtım Seçenekleri

1. Transformers ile Yerel Dağıtım

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Load model
model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",  # Local path
    torch_dtype=torch.float16,
    device_map="auto",
    trust_remote_code=True
)

tokenizer = AutoTokenizer.from_pretrained(
    "./kimi-k2-5",
    trust_remote_code=True
)

# Inference
inputs = tokenizer("Hello, Kimi!", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))

2. vLLM ile Üretim Ortamı Dağıtımı

# Install vLLM
uv pip install -U vllm --torch-backend=auto --extra-index-url https://wheels.vllm.ai/nightly

# Start server
vllm serve ./kimi-k2-5 \
    -tp 8 \
    --mm-encoder-tp-mode data \
    --trust-remote-code \
    --tool-call-parser kimi_k2 \
    --reasoning-parser kimi_k2

3. Docker Dağıtımı

FROM nvidia/cuda:12.1-devel-ubuntu22.04

WORKDIR /app

# Install dependencies
RUN pip install torch vllm transformers

# Copy model (or mount as volume)
COPY ./kimi-k2-5 /models/kimi-k2-5

# Expose port
EXPOSE 8000

# Start server
CMD python -m vllm.entrypoints.openai.api_server \
    --model /models/kimi-k2-5 \
    --tensor-parallel-size 4 \
    --host 0.0.0.0 \
    --port 8000
# Build and run
docker build -t kimi-k2-5 .
docker run --gpus all -p 8000:8000 kimi-k2-5

4. Kubernetes Dağıtımı

apiVersion: apps/v1
kind: Deployment
metadata:
  name: kimi-k2-5
spec:
  replicas: 1
  selector:
    matchLabels:
      app: kimi-k2-5
  template:
    metadata:
      labels:
        app: kimi-k2-5
    spec:
      containers:
      - name: vllm
        image: vllm/vllm-openai:latest
        args:
        - --model
        - /models/kimi-k2-5
        - --tensor-parallel-size
        - "4"
        volumeMounts:
        - name: model
          mountPath: /models
        resources:
          limits:
            nvidia.com/gpu: "4"
      volumes:
      - name: model
        persistentVolumeClaim:
          claimName: kimi-model-pvc

Bulut Dağıtım Seçenekleri

AWS

# Using Deep Learning AMI
aws ec2 run-instances \
    --image-id ami-xxx \
    --instance-type p4d.24xlarge \
    --key-name my-key

# Deploy with ECS/EKS
# Use GPU-optimized instances (p4d, p5)

Google Cloud Platform

# Using Deep Learning VM
gcloud compute instances create kimi-server \
    --zone=us-central1-a \
    --machine-type=a2-highgpu-4g \
    --image-family=pytorch-latest-gpu

Azure

# Using NC-series VMs
az vm create \
    --resource-group myRG \
    --name kimi-vm \
    --size Standard_NC24ads_A100_v4

Açık Kaynak Kimi K2.5'i Fine-Tune Etme

LoRA Fine-Tuning

from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments
from peft import LoraConfig, get_peft_model
import torch

# Load base model
model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    torch_dtype=torch.float16,
    device_map="auto",
    trust_remote_code=True
)

# Configure LoRA
lora_config = LoraConfig(
    r=16,
    lora_alpha=32,
    target_modules=["q_proj", "v_proj"],
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM"
)

# Apply LoRA
model = get_peft_model(model, lora_config)

# Training configuration
training_args = TrainingArguments(
    output_dir="./kimi-k2-5-finetuned",
    num_train_epochs=3,
    per_device_train_batch_size=1,
    gradient_accumulation_steps=4,
    learning_rate=2e-4,
    fp16=True,
    save_steps=100
)

# Train
from trl import SFTTrainer
trainer = SFTTrainer(
    model=model,
    args=training_args,
    train_dataset=dataset,
    tokenizer=tokenizer
)
trainer.train()

Full Fine-Tuning (önemli ölçüde kaynak gerektirir)

# For full fine-tuning, use DeepSpeed or FSDP
from accelerate import Accelerator

accelerator = Accelerator(deepspeed_plugin=deepspeed_plugin)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    trust_remote_code=True
)

# DeepSpeed config for distributed training
# Requires 8x H100 or equivalent

Kaynağı Kısıtlı Dağıtım İçin Kuantizasyon

8-bit Kuantizasyon

from transformers import AutoModelForCausalLM, BitsAndBytesConfig
import torch

bnb_config = BitsAndBytesConfig(
    load_in_8bit=True,
    bnb_8bit_compute_dtype=torch.float16
)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True
)

4-bit Kuantizasyon

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True
)

GGUF Formatı (llama.cpp)

Topluluk tarafından dönüştürülmüş GGUF dosyaları mevcuttur, ancak bunlar resmi Moonshot sürümleri değildir:

# Example community repo
# https://huggingface.co/unsloth/Kimi-K2.5-GGUF

# Inspect available files/tags in the chosen repo before running llama.cpp

Açık Kaynak Topluluğu

Katkıda Bulunma

Temel model ağırlıkları sabit olsa da, topluluk katkıları şunları içerir:

  • Fine-tune edilmiş varyantlar: Alana özgü uyarlamalar
  • Kuantize edilmiş sürümler: Farklı donanımlar için optimize edilmiş
  • Entegrasyon kütüphaneleri: Çeşitli framework'ler için SDK'lar
  • Dağıtım araçları: Kubernetes chart'ları, Docker image'ları

Popüler Topluluk Projeleri

ProjeAçıklamaBağlantı
MoonshotAI/Kimi-K2.5Resmi kod deposugithub.com/MoonshotAI/Kimi-K2.5
moonshotai/Kimi-K2.5 (HF)Resmi open-weights model kartı ve dosyalarıhuggingface.co/moonshotai/Kimi-K2.5
unsloth/Kimi-K2.5-GGUFTopluluk GGUF dönüştürme örneğihuggingface.co/unsloth/Kimi-K2.5-GGUF
KTransformers docsK2.5 dağıtım ve ayar referanslarıgithub.com/kvcache-ai/ktransformers

Uyumluluk ve En İyi Uygulamalar

Lisans Uyumluluğu Kontrol Listesi

  • Modified MIT License'ı baştan sona inceleyin
  • Herkese açık bir hizmet sunuyorsanız kullanıcı sayısını kontrol edin
  • Hosted erişimi yeniden satmadan önce ayrı API koşullarını gözden geçirin
  • Lisansı dağıtımlara dâhil edin
  • Moonshot AI'a uygun şekilde atıfta bulunun

Güvenlik Hususları

# Implement input validation
def validate_input(text):
    max_length = 100000  # Limit input size
    if len(text) > max_length:
        raise ValueError("Input too long")
    
    # Block harmful prompts
    blocked_terms = ["..."]  # Your list
    for term in blocked_terms:
        if term in text.lower():
            raise ValueError("Blocked content detected")
    
    return text

İzleme ve Loglama

import logging

logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

def generate_with_logging(prompt):
    logger.info(f"Generation request: {len(prompt)} chars")
    
    output = model.generate(**inputs)
    
    logger.info(f"Generated: {len(output)} tokens")
    return output

SSS

Kimi K2.5 gerçekten açık kaynak mı?

Kimi K2.5, Modified MIT License altında open weights olarak sunulur. Bu, yalnızca API üzerinden erişilen kapalı modellere kıyasla önemli ölçüde özgürlük sağlar; ancak eğitim verisini veya eksiksiz eğitim kodunu içermez (bu durum büyük yapay zekâ modelleri için olağandır).

Kimi K2.5'i ticari olarak kullanabilir miyim?

Evet, koşullarla birlikte. Modified MIT License, çoğu işletme için ticari kullanıma izin verir. Ürününüz/hizmetiniz 100M MAU veya aylık $20M geliri aşarsa, kullanıcıya yönelik arayüzlerde "Kimi K2.5" ibaresini belirgin biçimde göstermeniz gerekir.

Self-hosting maliyeti ne kadar?

Maliyetler bölgeye, bulut sağlayıcısına, kuantizasyon stratejisine ve throughput hedefine göre önemli ölçüde değişir. Bütçe planlarken güncel bulut hesaplayıcılarını ve resmi dağıtım rehberindeki örnekleri temel alın.

Kimi K2.5'i değiştirip yeniden dağıtabilir miyim?

Evet, modeli değiştirebilir, fine-tune edebilir ve değiştirdiğiniz sürümleri aynı lisans koşulları altında dağıtabilirsiniz. Buna türev modeller oluşturmak da dâhildir.

Açık kaynak kullanım açısından Kimi K2.5, Llama 3 ile nasıl kıyaslanır?

YönKimi K2.5Llama 3 / 3.1
ParametrelerToplam 1T / aktif 32BCheckpoint'e göre değişir
Bağlam256KSürüme göre değişir (Llama 3.1'de 128K'ya kadar)
LisansModified MITLlama Community License
TicariAtıf eşiği maddesiyle izinliLisansa özgü kısıtlamalarla izinli
DonanımTam kalitede genellikle zorlayıcıKüçük checkpoint'ler için çoğu zaman daha hafif

Kaynaklar

Kimi K2.5 Açık Kaynak: Lisans, Model Ağırlıkları ve Self-Hosting Rehberi 2026