Kimi K2.5 açık kaynak sürümü, son teknoloji yapay zekâya erişimi demokratikleştirme yolunda önemli bir kilometre taşını temsil ediyor. OpenAI ve Anthropic gibi şirketlerin tescilli (proprietary) modellerinin aksine, Moonshot AI Kimi K2.5'i Modified MIT License altında open weights olarak yayımladı; böylece araştırmacılar, geliştiriciler ve kurumlar modeli kendi koşullarına göre çalıştırabiliyor, değiştirebiliyor ve dağıtabiliyor.
Kimi K2.5 Açık Kaynak Genel Bakış
Kimi K2.5 İçin "Açık Kaynak" Ne Anlama Geliyor?
Kimi K2.5, bir open-weights modeli olarak yayımlanmıştır; bu da şu anlama gelir:
- ✅ Model ağırlıkları herkese açık olarak indirilebilir
- ✅ Yerel olarak veya özel altyapıda çalıştırılabilir
- ✅ Fine-tuning ve modifikasyona izin verilir
- ✅ Ticari kullanıma izin verilir (sınırlamalarla birlikte)
- ✅ API bağımlılığı gerektirmez
- ❌ Eğitim verisi herkese açık değildir
- ❌ Eksiksiz eğitim kodu yayımlanmamıştır
Diğer "Açık" Modellerle Karşılaştırma
| Model | Open Weights | Eğitim Verisi | Ticari Kullanım | Gerçek Açık Kaynak |
|---|---|---|---|---|
| Kimi K2.5 | ✅ Evet | ❌ Hayır | ✅ Modified MIT | ⚠️ Kısmen |
| Llama 3.1 | ✅ Evet | ❌ Hayır | ✅ Evet (sınırlamalarla) | ⚠️ Kısmen |
| Mistral | ✅ Evet | ❌ Hayır | ✅ Evet | ⚠️ Kısmen |
| GPT-4 | ❌ Hayır | ❌ Hayır | ❌ Yalnızca API | ❌ Hayır |
| Claude | ❌ Hayır | ❌ Hayır | ❌ Yalnızca API | ❌ Hayır |
Kimi K2.5 Modified MIT License Açıklaması
Lisans Genel Bakışı
Modified MIT License, geniş kapsamlı kullanıma izin verirken yüksek hacimli ticari dağıtımlar için bazı kısıtlamalar içerir.
Yapabilecekleriniz
| İzin | Ayrıntılar |
|---|---|
| Kullanım | Kişisel, akademik ve ticari kullanım |
| Değiştirme | Modeli fine-tune etme ve uyarlama |
| Dağıtım | Değişiklikleri ve türevleri paylaşma |
| Özel Kullanım | Özel altyapıda dağıtım |
| Sublicense | Daha büyük projelere dâhil etme |
Yapamayacaklarınız (Kısıtlamalar)
| Kısıtlama | Eşik | Ayrıntılar |
|---|---|---|
| Atıf Zorunluluğu | >100M MAU veya >$20M aylık gelir | Kullanıcıya yönelik ürün/hizmetlerde "Kimi K2.5" ibaresini belirgin biçimde göstermeniz gerekir |
| Zararlı Kullanım | Herhangi biri | Silah, gözetim vb. |
Tam Lisans Metni
Lisansın tamamına şu adresten ulaşılabilir: https://huggingface.co/moonshotai/Kimi-K2.5/blob/main/LICENSE
Temel maddeler:
Permission is hereby granted, free of charge, to any person obtaining a copy
of this model and associated documentation files (the "Model"), to deal
in the Model without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Model, subject to the following conditions:
1. If your product/service exceeds 100 million monthly active users
or $20 million in monthly revenue, you must prominently display "Kimi K2.5"
in all user-facing products/services.
2. Standard MIT-style notice obligations still apply.
Kimi K2.5 Ağırlıklarını İndirme
Resmi Dağıtım Kanalları
| Kaynak | URL | Format |
|---|---|---|
| HuggingFace | huggingface.co/moonshotai/Kimi-K2.5 | PyTorch / Safetensors |
| Model Scope | modelscope.cn/models/MoonshotAI/Kimi-K2.5 | PyTorch |
İndirme Yöntemleri
HuggingFace Hub Kullanımı
from huggingface_hub import snapshot_download
# Download complete model
model_path = snapshot_download(
repo_id="moonshotai/Kimi-K2.5",
local_dir="./kimi-k2-5",
local_dir_use_symlinks=False,
resume_download=True
)
Git LFS Kullanımı
# Install Git LFS
git lfs install
# Clone repository
git clone https://huggingface.co/moonshotai/Kimi-K2.5.git
# Or sparse checkout for specific files
git clone --filter=blob:none https://huggingface.co/moonshotai/Kimi-K2.5.git
wget/curl Kullanımı
# Download specific files
wget https://huggingface.co/moonshotai/Kimi-K2.5/resolve/main/config.json
wget https://huggingface.co/moonshotai/Kimi-K2.5/resolve/main/model.safetensors.index.json
Model Dosyalarının Yapısı
kimi-k2-5/
├── config.json # Model configuration
├── tokenizer.json # Tokenizer vocab
├── tokenizer_config.json # Tokenizer settings
├── model.safetensors.index.json # Weight index
├── model-00001-of-000064.safetensors # Shard 1
├── model-00002-of-000064.safetensors # Shard 2
├── ...
├── model-00064-of-000064.safetensors # Shard 64
├── generation_config.json # Generation defaults
└── LICENSE # License file
Kimi K2.5 Self-Hosting
Donanım Gereksinimleri
Moonshot'un resmi dağıtım rehberi, tek ve sabit bir "minimum" donanım özelliği yayımlamaz. Bunun yerine referans yapılandırmalar sunar:
| Senaryo | Resmi örnek | Notlar |
|---|---|---|
| vLLM / SGLang çıkarımı | Tensor parallel size 8 ile tek düğümlü H200 | Moonshot dağıtım rehberinden referans komut |
| KTransformers + SGLang çıkarımı | 8x NVIDIA L20 + 2x Intel 6454S | CPU+GPU heterojen çıkarım örneği |
| KTransformers + LLaMA-Factory ile LoRA SFT | 2x RTX 4090 + Intel 8488C (büyük RAM/swap ile) | Rehberden fine-tuning örneği |
Dağıtım Seçenekleri
1. Transformers ile Yerel Dağıtım
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
# Load model
model = AutoModelForCausalLM.from_pretrained(
"./kimi-k2-5", # Local path
torch_dtype=torch.float16,
device_map="auto",
trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained(
"./kimi-k2-5",
trust_remote_code=True
)
# Inference
inputs = tokenizer("Hello, Kimi!", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))
2. vLLM ile Üretim Ortamı Dağıtımı
# Install vLLM
uv pip install -U vllm --torch-backend=auto --extra-index-url https://wheels.vllm.ai/nightly
# Start server
vllm serve ./kimi-k2-5 \
-tp 8 \
--mm-encoder-tp-mode data \
--trust-remote-code \
--tool-call-parser kimi_k2 \
--reasoning-parser kimi_k2
3. Docker Dağıtımı
FROM nvidia/cuda:12.1-devel-ubuntu22.04
WORKDIR /app
# Install dependencies
RUN pip install torch vllm transformers
# Copy model (or mount as volume)
COPY ./kimi-k2-5 /models/kimi-k2-5
# Expose port
EXPOSE 8000
# Start server
CMD python -m vllm.entrypoints.openai.api_server \
--model /models/kimi-k2-5 \
--tensor-parallel-size 4 \
--host 0.0.0.0 \
--port 8000
# Build and run
docker build -t kimi-k2-5 .
docker run --gpus all -p 8000:8000 kimi-k2-5
4. Kubernetes Dağıtımı
apiVersion: apps/v1
kind: Deployment
metadata:
name: kimi-k2-5
spec:
replicas: 1
selector:
matchLabels:
app: kimi-k2-5
template:
metadata:
labels:
app: kimi-k2-5
spec:
containers:
- name: vllm
image: vllm/vllm-openai:latest
args:
- --model
- /models/kimi-k2-5
- --tensor-parallel-size
- "4"
volumeMounts:
- name: model
mountPath: /models
resources:
limits:
nvidia.com/gpu: "4"
volumes:
- name: model
persistentVolumeClaim:
claimName: kimi-model-pvc
Bulut Dağıtım Seçenekleri
AWS
# Using Deep Learning AMI
aws ec2 run-instances \
--image-id ami-xxx \
--instance-type p4d.24xlarge \
--key-name my-key
# Deploy with ECS/EKS
# Use GPU-optimized instances (p4d, p5)
Google Cloud Platform
# Using Deep Learning VM
gcloud compute instances create kimi-server \
--zone=us-central1-a \
--machine-type=a2-highgpu-4g \
--image-family=pytorch-latest-gpu
Azure
# Using NC-series VMs
az vm create \
--resource-group myRG \
--name kimi-vm \
--size Standard_NC24ads_A100_v4
Açık Kaynak Kimi K2.5'i Fine-Tune Etme
LoRA Fine-Tuning
from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments
from peft import LoraConfig, get_peft_model
import torch
# Load base model
model = AutoModelForCausalLM.from_pretrained(
"./kimi-k2-5",
torch_dtype=torch.float16,
device_map="auto",
trust_remote_code=True
)
# Configure LoRA
lora_config = LoraConfig(
r=16,
lora_alpha=32,
target_modules=["q_proj", "v_proj"],
lora_dropout=0.05,
bias="none",
task_type="CAUSAL_LM"
)
# Apply LoRA
model = get_peft_model(model, lora_config)
# Training configuration
training_args = TrainingArguments(
output_dir="./kimi-k2-5-finetuned",
num_train_epochs=3,
per_device_train_batch_size=1,
gradient_accumulation_steps=4,
learning_rate=2e-4,
fp16=True,
save_steps=100
)
# Train
from trl import SFTTrainer
trainer = SFTTrainer(
model=model,
args=training_args,
train_dataset=dataset,
tokenizer=tokenizer
)
trainer.train()
Full Fine-Tuning (önemli ölçüde kaynak gerektirir)
# For full fine-tuning, use DeepSpeed or FSDP
from accelerate import Accelerator
accelerator = Accelerator(deepspeed_plugin=deepspeed_plugin)
model = AutoModelForCausalLM.from_pretrained(
"./kimi-k2-5",
trust_remote_code=True
)
# DeepSpeed config for distributed training
# Requires 8x H100 or equivalent
Kaynağı Kısıtlı Dağıtım İçin Kuantizasyon
8-bit Kuantizasyon
from transformers import AutoModelForCausalLM, BitsAndBytesConfig
import torch
bnb_config = BitsAndBytesConfig(
load_in_8bit=True,
bnb_8bit_compute_dtype=torch.float16
)
model = AutoModelForCausalLM.from_pretrained(
"./kimi-k2-5",
quantization_config=bnb_config,
device_map="auto",
trust_remote_code=True
)
4-bit Kuantizasyon
bnb_config = BitsAndBytesConfig(
load_in_4bit=True,
bnb_4bit_quant_type="nf4",
bnb_4bit_compute_dtype=torch.float16,
bnb_4bit_use_double_quant=True
)
model = AutoModelForCausalLM.from_pretrained(
"./kimi-k2-5",
quantization_config=bnb_config,
device_map="auto",
trust_remote_code=True
)
GGUF Formatı (llama.cpp)
Topluluk tarafından dönüştürülmüş GGUF dosyaları mevcuttur, ancak bunlar resmi Moonshot sürümleri değildir:
# Example community repo
# https://huggingface.co/unsloth/Kimi-K2.5-GGUF
# Inspect available files/tags in the chosen repo before running llama.cpp
Açık Kaynak Topluluğu
Katkıda Bulunma
Temel model ağırlıkları sabit olsa da, topluluk katkıları şunları içerir:
- Fine-tune edilmiş varyantlar: Alana özgü uyarlamalar
- Kuantize edilmiş sürümler: Farklı donanımlar için optimize edilmiş
- Entegrasyon kütüphaneleri: Çeşitli framework'ler için SDK'lar
- Dağıtım araçları: Kubernetes chart'ları, Docker image'ları
Popüler Topluluk Projeleri
| Proje | Açıklama | Bağlantı |
|---|---|---|
| MoonshotAI/Kimi-K2.5 | Resmi kod deposu | github.com/MoonshotAI/Kimi-K2.5 |
| moonshotai/Kimi-K2.5 (HF) | Resmi open-weights model kartı ve dosyaları | huggingface.co/moonshotai/Kimi-K2.5 |
| unsloth/Kimi-K2.5-GGUF | Topluluk GGUF dönüştürme örneği | huggingface.co/unsloth/Kimi-K2.5-GGUF |
| KTransformers docs | K2.5 dağıtım ve ayar referansları | github.com/kvcache-ai/ktransformers |
Uyumluluk ve En İyi Uygulamalar
Lisans Uyumluluğu Kontrol Listesi
- Modified MIT License'ı baştan sona inceleyin
- Herkese açık bir hizmet sunuyorsanız kullanıcı sayısını kontrol edin
- Hosted erişimi yeniden satmadan önce ayrı API koşullarını gözden geçirin
- Lisansı dağıtımlara dâhil edin
- Moonshot AI'a uygun şekilde atıfta bulunun
Güvenlik Hususları
# Implement input validation
def validate_input(text):
max_length = 100000 # Limit input size
if len(text) > max_length:
raise ValueError("Input too long")
# Block harmful prompts
blocked_terms = ["..."] # Your list
for term in blocked_terms:
if term in text.lower():
raise ValueError("Blocked content detected")
return text
İzleme ve Loglama
import logging
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)
def generate_with_logging(prompt):
logger.info(f"Generation request: {len(prompt)} chars")
output = model.generate(**inputs)
logger.info(f"Generated: {len(output)} tokens")
return output
SSS
Kimi K2.5 gerçekten açık kaynak mı?
Kimi K2.5, Modified MIT License altında open weights olarak sunulur. Bu, yalnızca API üzerinden erişilen kapalı modellere kıyasla önemli ölçüde özgürlük sağlar; ancak eğitim verisini veya eksiksiz eğitim kodunu içermez (bu durum büyük yapay zekâ modelleri için olağandır).
Kimi K2.5'i ticari olarak kullanabilir miyim?
Evet, koşullarla birlikte. Modified MIT License, çoğu işletme için ticari kullanıma izin verir. Ürününüz/hizmetiniz 100M MAU veya aylık $20M geliri aşarsa, kullanıcıya yönelik arayüzlerde "Kimi K2.5" ibaresini belirgin biçimde göstermeniz gerekir.
Self-hosting maliyeti ne kadar?
Maliyetler bölgeye, bulut sağlayıcısına, kuantizasyon stratejisine ve throughput hedefine göre önemli ölçüde değişir. Bütçe planlarken güncel bulut hesaplayıcılarını ve resmi dağıtım rehberindeki örnekleri temel alın.
Kimi K2.5'i değiştirip yeniden dağıtabilir miyim?
Evet, modeli değiştirebilir, fine-tune edebilir ve değiştirdiğiniz sürümleri aynı lisans koşulları altında dağıtabilirsiniz. Buna türev modeller oluşturmak da dâhildir.
Açık kaynak kullanım açısından Kimi K2.5, Llama 3 ile nasıl kıyaslanır?
| Yön | Kimi K2.5 | Llama 3 / 3.1 |
|---|---|---|
| Parametreler | Toplam 1T / aktif 32B | Checkpoint'e göre değişir |
| Bağlam | 256K | Sürüme göre değişir (Llama 3.1'de 128K'ya kadar) |
| Lisans | Modified MIT | Llama Community License |
| Ticari | Atıf eşiği maddesiyle izinli | Lisansa özgü kısıtlamalarla izinli |
| Donanım | Tam kalitede genellikle zorlayıcı | Küçük checkpoint'ler için çoğu zaman daha hafif |