Welche storageClass soll ich in der Produktion verwenden?

replicated ist die Standardempfehlung für die Produktion. Sie repliziert Ihre persistenten Volumes synchron über die drei Schweizer Rechenzentren - Ihre Daten bleiben auch bei einem Standortausfall zugänglich. local ist schneller (eine einzige Kopie, weniger Latenz), aber ohne Hochverfügbarkeit auf Speicherebene - reservieren Sie sie für die Entwicklung oder wirklich temporäre Daten.

Wie fügt man GPU-Nodes zu einem bestehenden Cluster hinzu?

Fügen Sie eine neue Nodegroup mit dem Feld gpus[] in Ihrem Manifest hinzu, aktivieren Sie das gpuOperator-Addon und wenden Sie es an. Der GPU Operator installiert die NVIDIA-Treiber automatisch auf den neuen Nodes. Hinweis: JJeder Node der GPU-Nodegroup verbraucht eine physische GPU. Eine Nodegroup mit minReplicas: 4 beansprucht ständig 4 GPUs - verwenden Sie minReplicas: 0, wenn Ihre GPU-Workloads nur zeitweise anfallen.

Wie erhalte ich meine kubeconfig?

Die kubeconfig wird bei der Cluster-Erstellung automatisch generiert und in einem Kubernetes Secret gespeichert.

Kann ich FluxCD verwenden, um meine Anwendungen bereitzustellen?

Ja - Aktiviere Sie das fluxcd-Addon im Cluster-Manifest mit der URL Ihres Git-Repositorys. FluxCD synchronisiert automatisch alle YAML-Manifeste des Repositoriums in Ihrem Cluster. Ein Push auf Ihren Hauptbranch löst ein Deployment ohne manuelle Aktion aus. Für private Repositorys konfigurieren Sie nach dem ersten Flux-Deployment die SSH- oder Token-Authentifizierung im Cluster.

GEMANAGTES KUBERNETES

Ein Kubernetes-Cluster
production-ready in 5 Minuten.

Control Plane vollständig von Hikube verwaltet, Node Workers in Ihrem Projekt. Replizierter Speicher in 3 Rechenzentren. Sie behalten die Kontrolle über Ihre Workloads, wir kümmern uns um den Rest.

KONTAKTIEREN SIE UNSERE EXPERTEN ARCHITEKTUR ANSEHEN

Verfügbare Addons

kubectl

Helm

FluxCD

cert-manager

Cilium

wartungsfreie, verwaltete control plane
kube-apiserver, etcd, scheduler und controller-manager werden von Hikube gehostet und betrieben. Über mehrere Standorte hinweg repliziert.
Workers-Knoten in Ihrem Projekt
Ihre Workers sind VMs in Ihrem tenant. Sie konfigurieren sie über deklarative node groups - Instanztyp, Skalierung, Rollen, GPU.
Replizierter Speicher in drei Rechenzentren.
Ihre persistenten Volumes werden automatisch auf Genf, Gland und Luzern repliziert. Native Hochverfügbarkeit auf Speicherebene.
Kubernetes API als Standard.
Zugriff über kubectl, Client-SDK, Terraform oder jedes kompatible Tool. Keine proprietären Tools erforderlich.
Cilium als standardmäßiger CNI.
Pod-to-Pod-Netzwerk, NetworkPolicies und Hubble-Observabilität enthalten. Default-allow-Politik jederzeit änderbar.

CONTROL PLANE - VERWALTET VON HIKUBE

kube-apiserver etcd x3 scheduler controller-manager

NODE GROUPS

Workers (Ihr Projekt)

VMs mit autoscaling min/max. Getrennt nach Rollen und Lasttypen...

NETZWERK

Cilium CNI

NetworkPolicy, Hubble observability, LoadBalancer, Ingress NGINX.

STOCKAGE

Repliziertes PVC

Dynamisches Provisioning. 3 Backends: Geneva - Gland - Luzern.

yaml

apiVersion: apps.cozystack.io/v1alpha1
kind: Kubernetes
metadata:
  name: my-first-cluster
spec:
  controlPlane:
    replicas: 2
    storageClass: "replicated"
  nodeGroups:
    general:
      minReplicas: 1
      maxReplicas: 5
      instanceType: "s1.large" # 4 vCPU, 8 GB RAM
      ephemeralstorage: 50G1
      resources：{}
      roles:
        - ingress-nginx
addons:
  certManager:
    enabled: true
  ingressNginx:
    enabled: true

bash

# Stellen Sie den Cluster bereit.
kubectl apply -f my-first-cluster. yaml

# Rufen Sie den kubeconfig ab.
kubectl get tenantsecret my-first-cluster admin-
kubeconfig \
 -o jsonpath='{.data.super-admin}'. \
 | base64 -d > kubeconfig.yaml

# Überprüfen Sie die Knotenpunkte.
export KUBECONFIG-kubeconfig.yaml
kubectl get nodes

Einige Punkte, die Sie sich für einen guten Start merken sollten:

replicas: 3 für die Produktion
Eine ungerade Anzahl von Replikas wird empfohlen, um das etcd-Quorum und die Hochverfügbarkeit der control plane zu gewährleisten.
resources: {} ist obligatorisch.
Jede Node-Gruppe muss dieses Feld deklarieren, auch wenn es leer ist. Ohne dieses Feld werden die CPU/RAM-Werte nicht vom instanceType vererbt.
Trennen Sie Ihre Knotengruppen nach Rollen.
Web, Compute, Monitoring, GPU - getrennte Gruppen ermöglichen ein unabhängiges Autoscaling und eine bessere Kostenkontrolle.
Skalierung auf Null für GPU-Workloads.
minReplicas: 0 auf einer GPU-Nodegruppe ermöglicht es, nur dann Ressourcen zu verbrauchen, wenn GPU-Pods tatsächlich geplant sind.

s1 - Standard

1:2

vCPU:RAM

Allgemeine Workloads, Webserver

u1 - Universal

1:4

vCPU:RAM

Geschäftsanwendungen, Datenbanken

m1 - Memory

1:8

vCPU:RAM

Cache, analytics, monitoring, ML

Die bewährte Praxis ist, den Bereich an die Rolle der Node Group anzupassen:

s1 für allgemeine Workers und Ingress.
Ausgewogenes CPU:RAM-Verhältnis für Webanwendungen und Microservices ohne besonderen Speicherbedarf.
u1 für Compute und GPU-Workloads.
Mehr RAM pro Kern, empfohlen für ML-Pipelines und Datenbanken. Verhältnis angepasst an 8-16 vCPUs pro GPU.
m1 für verbrauchsintensive Workloads.
Ideal für Monitoring, Caches und Indexe-Engines, die RAM gegenüber CPUs bevorzugen.

Lokal

Ein einziges Rechenzentrum

Keine Replikation, minimale Latenz

replicated

Synchrones Multi-Datacenter

Bestätigtes Schreiben an allen 3 Standorten vor der Rückkehr

replicated-async

Asynchrones Multi-Datacenter

Lokales Schreiben und dann verzögerte Ausbreitung

Automatische TLS-Zertifikate über Let's Encrypt oder Ihre private Behörde. Automatische Verlängerung.

Erweitertes HTTP/HTTPS-Routing nach dem Kubernetes-Standard. Feinsteuerung des eingehenden Datenverkehrs und Multi-Protokoll-Unterstützung.

Node Exporter, Fluent Bit, Kube-State-Metrics. Grafana- und VictoriaMetrics-Integration des Projekts.

Automatische NVIDIA-Treiber auf GPU-Knoten. Erforderlich für die Nutzung von GPU-Workloads in Kubernetes.

Natives GitOps, das eine kontinuierliche Synchronisation von Ihrem Git-Repository aus gewährleistet. Automatisierte Deployments und Rollbacks.

Application Stack mit Ingress und TLS

Web-Group-Node mit ingress-nginx-Rolle, Cert-Manager für Let's Encrypt-Zertifikate, Autoskalierung zwischen 2 und 10 Knoten je nach Datenverkehr.

sl.large ingress-nginx cert-manager replicated

Kontinuierliche Bereitstellungen aus Git mit FluxCD

FluxCD synchronisiert Ihr Git-Repository jede Minute. Push auf main = automatische Bereitstellung im Cluster. Rollback über Git revert.

fluxcd cert-manager cert-ingress-nginx

Hybrid-Cluster aus CPU + GPU mit Scale to Zero

GPU-Knotengruppe mit minReplicas: 0 - GPU-Knoten laufen nur, wenn Jobs geplant werden. CPU-Knotengruppe: Permanent für die Orchestrierung.

u1.2xbreit L40S GPU gpuOperator 500Gi

Node group dedicated to monitoring

Node group m1.xlarge mit Monitoring-Rolle und großzügigem ephemeren Speicher (200Gi). VictoriaMetrics, Grafana und Fluent Bit isoliert vom Rest der Workloads.

m1.xlarge monitoringAgenten 200Gi

Warum gemanagtes Kubernetes

Weniger Ops, mehr Zeit für Ihre Workloads.

Eine Kubernetes-Control-Plane in Produktion zu halten, bedeutet, Versionsupgrades zu verwalten, die Gesundheit von etcd zu überwachen, interne Zertifikate zu verwalten und sicherzustellen, dass das Quorum jederzeit erhalten bleibt. Das ist nicht kompliziert, kostet aber Zeit und Aufmerksamkeit.

Auf Hikube fällt dieser operative Aufwand weg. Sie deklarieren, was Sie wollen: Clustergröße, Knotengruppen, Add-ons und die Plattform kümmert sich um den Rest. Sie behalten den vollen Zugriff über die standardmäßige Kubernetes-API: kubectl, Helm, Terraform und FluxCD funktionieren genau wie auf einem selbstverwalteten Cluster.

Die Multi-Datacenter-Replikation an drei Schweizer Standorten ist für Ihre Workloads transparent. Ihre PVCs sind auch dann verfügbar, wenn ein Datacenter nicht erreichbar ist, ohne zusätzliche Konfiguration auf Ihrer Seite.

Es kommt darauf an, was auf den Knoten läuft. Für klassische Webanwendungen und Microservices ist s1 (Verhältnis 1:2) der richtige Ausgangspunkt. Für Datenbanken, Datenpipelines oder GPU-Worker bevorzugen Sie u1 (Verhältnis 1:4), das mehr RAM pro Kern liefert. Reservieren Sie m1 (Verhältnis 1:8) für wirklich speicherintensive Lasten - Monitoring, Caches, Analytics.

Das Autoscaling wird durch minReplicas und maxReplicas auf jeder Node Group gesteuert. Wenn Pods mangels Ressourcen im Status Pending bleiben, werden automatisch neue Knoten bereitgestellt. Wenn die Last abnimmt, werden nicht ausgelastete Knoten gelöscht - ohne unter minReplicas zu gehen.

Sie können die Grenzwerte jederzeit anpassen, indem Sie das Manifest ändern und kubectl apply erneut starten. Für GPU- oder Entwicklungs-Workloads erlaubt minReplicas: 0 das Herunterfahren auf null Knoten, wenn es nichts zu tun gibt - planen Sie ein paar Minuten cold start beim ersten geplanten Pod ein.

replicated ist die Standardempfehlung für die Produktion. Sie repliziert Ihre persistenten Volumes synchron über die drei Schweizer Rechenzentren - Ihre Daten bleiben auch dann zugänglich, wenn ein Standort ausfällt.

local ist schneller (eine einzige Kopie, weniger Latenz), aber ohne Hochverfügbarkeit auf Speicherebene - reservieren Sie sie für die Entwicklung oder wirklich temporäre Daten.

Fügen Sie eine neue Knotengruppe mit dem Feld gpus[] in Ihrem Manifest hinzu, aktivieren Sie das gpuOperator-Addon und wenden Sie es an. Der GPU Operator übernimmt die Installation der NVIDIA-Treiber auf den neuen Knoten automatisch.

Beachten Sie: Jeder Knoten in der Knotengruppe GPU verbraucht einen physischen Grafikprozessor. Eine Knotengruppe mit minReplicas: 4 beansprucht ständig 4 GPUs - verwenden Sie minReplicas: 0, wenn Ihre GPU-Workloads nur zeitweise anfallen.

Das kubeconfig wird bei der Erstellung des Clusters automatisch generiert und in einem Kubernetes Secret gespeichert.

Ja - Aktiviere das fluxcd-Addon im Clustermanifest mit der URL deines Git-Repositorys. FluxCD synchronisiert automatisch alle YAML-Manifeste des Repositoriums in Ihrem Cluster. Ein Push auf Ihrem Hauptzweig löst eine Bereitstellung aus, ohne dass eine manuelle Aktion erforderlich ist.

Für private Repositories konfigurieren Sie die SSH- oder Token-Authentifizierung im Cluster nach der ersten Bereitstellung von Flux.

Ein Kubernetes-Clusterproduction-ready in 5 Minuten.

3 DC

5 mins

0 Masters

API K8's

Ein schlüsselfertiges, verwaltetes Kubernetes.

CONTROL PLANE - VERWALTET VON HIKUBE

NODE GROUPS

Workers (Ihr Projekt)

NETZWERK

Cilium CNI

STOCKAGE

Repliziertes PVC

Vollständig deklarative Konfiguration

Ein Cluster in ein paar Zeilen YAML.

Drei Produktreihen für jeden Workload-Typ.

Beispiele:

PVCs, die auf drei Rechenzentren repliziert werden.

Aktivieren Sie, was Sie brauchen

Cert-Manager

Gateway API

Monitoring

GPU Operator

FluxCD

Häufige Architekturen auf Hikube.

WEBANWENDUNG

GITOPS

ML / AI

OBSERVABILITÄT

Weniger Ops, mehr Zeit für Ihre Workloads.

Keine Wartung des control plane

GPU und CPU auf demselben Cluster

Deklaratives und automatisches Scaling

Daten in der Schweiz, souveräne Architektur

Frage zu Kubernetes as a Service

Welche Instanz soll ich für meine Workers wählen?

Wie funktioniert Autoscaling?

Welche storageClass soll in der Produktion verwendet werden?

Wie fügt man GPU-Knoten zu einem bestehenden Cluster hinzu?

Wie bekomme ich meinen kubeconfig zurück?

Kann ich FluxCD verwenden, um meine Anwendungen bereitzustellen?

Ein Kubernetes-Cluster
production-ready in 5 Minuten.