Kimi K2.5 Açık Kaynak: Lisans, Model Ağırlıkları ve Self-Hosting Rehberi 2026

Kimi K2.5 açık kaynak sürümü, son teknoloji yapay zekâya erişimi demokratikleştirme yolunda önemli bir kilometre taşını temsil ediyor. OpenAI ve Anthropic gibi şirketlerin tescilli (proprietary) modellerinin aksine, Moonshot AI Kimi K2.5'i Modified MIT License altında open weights olarak yayımladı; böylece araştırmacılar, geliştiriciler ve kurumlar modeli kendi koşullarına göre çalıştırabiliyor, değiştirebiliyor ve dağıtabiliyor.

Kimi K2.5 Açık Kaynak Genel Bakış

Kimi K2.5 İçin "Açık Kaynak" Ne Anlama Geliyor?

Kimi K2.5, bir open-weights modeli olarak yayımlanmıştır; bu da şu anlama gelir:

✅ Model ağırlıkları herkese açık olarak indirilebilir
✅ Yerel olarak veya özel altyapıda çalıştırılabilir
✅ Fine-tuning ve modifikasyona izin verilir
✅ Ticari kullanıma izin verilir (sınırlamalarla birlikte)
✅ API bağımlılığı gerektirmez
❌ Eğitim verisi herkese açık değildir
❌ Eksiksiz eğitim kodu yayımlanmamıştır

Diğer "Açık" Modellerle Karşılaştırma

Model	Open Weights	Eğitim Verisi	Ticari Kullanım	Gerçek Açık Kaynak
Kimi K2.5	✅ Evet	❌ Hayır	✅ Modified MIT	⚠️ Kısmen
Llama 3.1	✅ Evet	❌ Hayır	✅ Evet (sınırlamalarla)	⚠️ Kısmen
Mistral	✅ Evet	❌ Hayır	✅ Evet	⚠️ Kısmen
GPT-4	❌ Hayır	❌ Hayır	❌ Yalnızca API	❌ Hayır
Claude	❌ Hayır	❌ Hayır	❌ Yalnızca API	❌ Hayır

Kimi K2.5 Modified MIT License Açıklaması

Lisans Genel Bakışı

Modified MIT License, geniş kapsamlı kullanıma izin verirken yüksek hacimli ticari dağıtımlar için bazı kısıtlamalar içerir.

Yapabilecekleriniz

İzin	Ayrıntılar
Kullanım	Kişisel, akademik ve ticari kullanım
Değiştirme	Modeli fine-tune etme ve uyarlama
Dağıtım	Değişiklikleri ve türevleri paylaşma
Özel Kullanım	Özel altyapıda dağıtım
Sublicense	Daha büyük projelere dâhil etme

Yapamayacaklarınız (Kısıtlamalar)

Kısıtlama	Eşik	Ayrıntılar
Atıf Zorunluluğu	>100M MAU veya >$20M aylık gelir	Kullanıcıya yönelik ürün/hizmetlerde "Kimi K2.5" ibaresini belirgin biçimde göstermeniz gerekir
Zararlı Kullanım	Herhangi biri	Silah, gözetim vb.

Tam Lisans Metni

Lisansın tamamına şu adresten ulaşılabilir: https://huggingface.co/moonshotai/Kimi-K2.5/blob/main/LICENSE

Temel maddeler:

Permission is hereby granted, free of charge, to any person obtaining a copy
of this model and associated documentation files (the "Model"), to deal
in the Model without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Model, subject to the following conditions:

1. If your product/service exceeds 100 million monthly active users
   or $20 million in monthly revenue, you must prominently display "Kimi K2.5"
   in all user-facing products/services.

2. Standard MIT-style notice obligations still apply.

Kimi K2.5 Ağırlıklarını İndirme

Resmi Dağıtım Kanalları

Kaynak	URL	Format
HuggingFace	huggingface.co/moonshotai/Kimi-K2.5	PyTorch / Safetensors
Model Scope	modelscope.cn/models/MoonshotAI/Kimi-K2.5	PyTorch

İndirme Yöntemleri

HuggingFace Hub Kullanımı

from huggingface_hub import snapshot_download

# Download complete model
model_path = snapshot_download(
    repo_id="moonshotai/Kimi-K2.5",
    local_dir="./kimi-k2-5",
    local_dir_use_symlinks=False,
    resume_download=True
)

Git LFS Kullanımı

# Install Git LFS
git lfs install

# Clone repository
git clone https://huggingface.co/moonshotai/Kimi-K2.5.git

# Or sparse checkout for specific files
git clone --filter=blob:none https://huggingface.co/moonshotai/Kimi-K2.5.git

wget/curl Kullanımı

# Download specific files
wget https://huggingface.co/moonshotai/Kimi-K2.5/resolve/main/config.json
wget https://huggingface.co/moonshotai/Kimi-K2.5/resolve/main/model.safetensors.index.json

Model Dosyalarının Yapısı

kimi-k2-5/
├── config.json              # Model configuration
├── tokenizer.json           # Tokenizer vocab
├── tokenizer_config.json    # Tokenizer settings
├── model.safetensors.index.json  # Weight index
├── model-00001-of-000064.safetensors  # Shard 1
├── model-00002-of-000064.safetensors  # Shard 2
├── ...
├── model-00064-of-000064.safetensors  # Shard 64
├── generation_config.json   # Generation defaults
└── LICENSE                  # License file

Kimi K2.5 Self-Hosting

Donanım Gereksinimleri

Moonshot'un resmi dağıtım rehberi, tek ve sabit bir "minimum" donanım özelliği yayımlamaz. Bunun yerine referans yapılandırmalar sunar:

Senaryo	Resmi örnek	Notlar
vLLM / SGLang çıkarımı	Tensor parallel size 8 ile tek düğümlü H200	Moonshot dağıtım rehberinden referans komut
KTransformers + SGLang çıkarımı	8x NVIDIA L20 + 2x Intel 6454S	CPU+GPU heterojen çıkarım örneği
KTransformers + LLaMA-Factory ile LoRA SFT	2x RTX 4090 + Intel 8488C (büyük RAM/swap ile)	Rehberden fine-tuning örneği

Dağıtım Seçenekleri

1. Transformers ile Yerel Dağıtım

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Load model
model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",  # Local path
    torch_dtype=torch.float16,
    device_map="auto",
    trust_remote_code=True
)

tokenizer = AutoTokenizer.from_pretrained(
    "./kimi-k2-5",
    trust_remote_code=True
)

# Inference
inputs = tokenizer("Hello, Kimi!", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))

2. vLLM ile Üretim Ortamı Dağıtımı

# Install vLLM
uv pip install -U vllm --torch-backend=auto --extra-index-url https://wheels.vllm.ai/nightly

# Start server
vllm serve ./kimi-k2-5 \
    -tp 8 \
    --mm-encoder-tp-mode data \
    --trust-remote-code \
    --tool-call-parser kimi_k2 \
    --reasoning-parser kimi_k2

3. Docker Dağıtımı

FROM nvidia/cuda:12.1-devel-ubuntu22.04

WORKDIR /app

# Install dependencies
RUN pip install torch vllm transformers

# Copy model (or mount as volume)
COPY ./kimi-k2-5 /models/kimi-k2-5

# Expose port
EXPOSE 8000

# Start server
CMD python -m vllm.entrypoints.openai.api_server \
    --model /models/kimi-k2-5 \
    --tensor-parallel-size 4 \
    --host 0.0.0.0 \
    --port 8000

# Build and run
docker build -t kimi-k2-5 .
docker run --gpus all -p 8000:8000 kimi-k2-5

4. Kubernetes Dağıtımı

apiVersion: apps/v1
kind: Deployment
metadata:
  name: kimi-k2-5
spec:
  replicas: 1
  selector:
    matchLabels:
      app: kimi-k2-5
  template:
    metadata:
      labels:
        app: kimi-k2-5
    spec:
      containers:
      - name: vllm
        image: vllm/vllm-openai:latest
        args:
        - --model
        - /models/kimi-k2-5
        - --tensor-parallel-size
        - "4"
        volumeMounts:
        - name: model
          mountPath: /models
        resources:
          limits:
            nvidia.com/gpu: "4"
      volumes:
      - name: model
        persistentVolumeClaim:
          claimName: kimi-model-pvc

Bulut Dağıtım Seçenekleri

AWS

# Using Deep Learning AMI
aws ec2 run-instances \
    --image-id ami-xxx \
    --instance-type p4d.24xlarge \
    --key-name my-key

# Deploy with ECS/EKS
# Use GPU-optimized instances (p4d, p5)

Google Cloud Platform

# Using Deep Learning VM
gcloud compute instances create kimi-server \
    --zone=us-central1-a \
    --machine-type=a2-highgpu-4g \
    --image-family=pytorch-latest-gpu

Azure

# Using NC-series VMs
az vm create \
    --resource-group myRG \
    --name kimi-vm \
    --size Standard_NC24ads_A100_v4

Açık Kaynak Kimi K2.5'i Fine-Tune Etme

LoRA Fine-Tuning

from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments
from peft import LoraConfig, get_peft_model
import torch

# Load base model
model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    torch_dtype=torch.float16,
    device_map="auto",
    trust_remote_code=True
)

# Configure LoRA
lora_config = LoraConfig(
    r=16,
    lora_alpha=32,
    target_modules=["q_proj", "v_proj"],
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM"
)

# Apply LoRA
model = get_peft_model(model, lora_config)

# Training configuration
training_args = TrainingArguments(
    output_dir="./kimi-k2-5-finetuned",
    num_train_epochs=3,
    per_device_train_batch_size=1,
    gradient_accumulation_steps=4,
    learning_rate=2e-4,
    fp16=True,
    save_steps=100
)

# Train
from trl import SFTTrainer
trainer = SFTTrainer(
    model=model,
    args=training_args,
    train_dataset=dataset,
    tokenizer=tokenizer
)
trainer.train()

Full Fine-Tuning (önemli ölçüde kaynak gerektirir)

# For full fine-tuning, use DeepSpeed or FSDP
from accelerate import Accelerator

accelerator = Accelerator(deepspeed_plugin=deepspeed_plugin)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    trust_remote_code=True
)

# DeepSpeed config for distributed training
# Requires 8x H100 or equivalent

Kaynağı Kısıtlı Dağıtım İçin Kuantizasyon

8-bit Kuantizasyon

from transformers import AutoModelForCausalLM, BitsAndBytesConfig
import torch

bnb_config = BitsAndBytesConfig(
    load_in_8bit=True,
    bnb_8bit_compute_dtype=torch.float16
)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True
)

4-bit Kuantizasyon

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    "./kimi-k2-5",
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True
)

GGUF Formatı (llama.cpp)

Topluluk tarafından dönüştürülmüş GGUF dosyaları mevcuttur, ancak bunlar resmi Moonshot sürümleri değildir:

# Example community repo
# https://huggingface.co/unsloth/Kimi-K2.5-GGUF

# Inspect available files/tags in the chosen repo before running llama.cpp

Açık Kaynak Topluluğu

Katkıda Bulunma

Temel model ağırlıkları sabit olsa da, topluluk katkıları şunları içerir:

Fine-tune edilmiş varyantlar: Alana özgü uyarlamalar
Kuantize edilmiş sürümler: Farklı donanımlar için optimize edilmiş
Entegrasyon kütüphaneleri: Çeşitli framework'ler için SDK'lar
Dağıtım araçları: Kubernetes chart'ları, Docker image'ları

Popüler Topluluk Projeleri

Proje	Açıklama	Bağlantı
MoonshotAI/Kimi-K2.5	Resmi kod deposu	github.com/MoonshotAI/Kimi-K2.5
moonshotai/Kimi-K2.5 (HF)	Resmi open-weights model kartı ve dosyaları	huggingface.co/moonshotai/Kimi-K2.5
unsloth/Kimi-K2.5-GGUF	Topluluk GGUF dönüştürme örneği	huggingface.co/unsloth/Kimi-K2.5-GGUF
KTransformers docs	K2.5 dağıtım ve ayar referansları	github.com/kvcache-ai/ktransformers

Uyumluluk ve En İyi Uygulamalar

Lisans Uyumluluğu Kontrol Listesi

Modified MIT License'ı baştan sona inceleyin
Herkese açık bir hizmet sunuyorsanız kullanıcı sayısını kontrol edin
Hosted erişimi yeniden satmadan önce ayrı API koşullarını gözden geçirin
Lisansı dağıtımlara dâhil edin
Moonshot AI'a uygun şekilde atıfta bulunun

Güvenlik Hususları

# Implement input validation
def validate_input(text):
    max_length = 100000  # Limit input size
    if len(text) > max_length:
        raise ValueError("Input too long")
    
    # Block harmful prompts
    blocked_terms = ["..."]  # Your list
    for term in blocked_terms:
        if term in text.lower():
            raise ValueError("Blocked content detected")
    
    return text

İzleme ve Loglama

import logging

logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

def generate_with_logging(prompt):
    logger.info(f"Generation request: {len(prompt)} chars")
    
    output = model.generate(**inputs)
    
    logger.info(f"Generated: {len(output)} tokens")
    return output

SSS

Kimi K2.5 gerçekten açık kaynak mı?

Kimi K2.5, Modified MIT License altında open weights olarak sunulur. Bu, yalnızca API üzerinden erişilen kapalı modellere kıyasla önemli ölçüde özgürlük sağlar; ancak eğitim verisini veya eksiksiz eğitim kodunu içermez (bu durum büyük yapay zekâ modelleri için olağandır).

Kimi K2.5'i ticari olarak kullanabilir miyim?

Evet, koşullarla birlikte. Modified MIT License, çoğu işletme için ticari kullanıma izin verir. Ürününüz/hizmetiniz 100M MAU veya aylık $20M geliri aşarsa, kullanıcıya yönelik arayüzlerde "Kimi K2.5" ibaresini belirgin biçimde göstermeniz gerekir.

Yön	Kimi K2.5	Llama 3 / 3.1
Parametreler	Toplam 1T / aktif 32B	Checkpoint'e göre değişir
Bağlam	256K	Sürüme göre değişir (Llama 3.1'de 128K'ya kadar)
Lisans	Modified MIT	Llama Community License
Ticari	Atıf eşiği maddesiyle izinli	Lisansa özgü kısıtlamalarla izinli
Donanım	Tam kalitede genellikle zorlayıcı	Küçük checkpoint'ler için çoğu zaman daha hafif

Kimi K2.5 Açık Kaynak: Lisans, Model Ağırlıkları ve Self-Hosting Rehberi 2026

İçindekiler