מדריך מתקדם לניהול ואופטימיזציה של שרתים
1. כוונון ביצועי השרת
אופטימיזציה ברמת הקרנל
-
קרנלים מותאמים אישית: לינוקס 6.x עם בקרת עומס BBR2
-
שינויים בערימת TCP:
# הגדלת גודל המאגרים המרביים של TCP echo 'net.core.rmem_max=4194304' >> /etc/sysctl.conf echo 'net.core.wmem_max=4194304' >> /etc/sysctl.conf
-
כיוונון Swappiness: מוגדר ל-10 עבור שרתי מסד נתונים
אופטימיזציית מסד נתונים
-
מיועד ל-MySQL 8.0+:
SET GLOBAL innodb_buffer_pool_size=12G; -- לשרתים עם 16GB RAM SET GLOBAL innodb_io_capacity=2000; -- לאחסון SSD/NVMe
-
כוונון PostgreSQL 14+:
ALTER SYSTEM SET shared_buffers = '4GB'; ALTER SYSTEM SET effective_cache_size = '12GB';
2. הגדרות אבטחה מתקדמות
יישום Zero-Trust
-
פילוח רשת:
-
שרתים בפרונטאנד ב-DMZ עם כללי גישה נוקשים
-
שרתים למסדי נתונים ב-VLAN פרטי עם IPים ברשימת לבן בלבד
-
-
אימות שירות לשירות:
-
TLS הדדי (mTLS) לתקשורת פנימית
-
SPIFFE/SPIRE לניהול זהויות
-
הגנה בזמן ריצה:
# התקנה והגדרה של Falco לאבטחת זמן ריצה
curl -s https://falco.org/repo/falcosecurity-3672BA8F.asc | apt-key add -
echo "deb https://download.falco.org/packages/deb stable main" | tee -a /etc/apt/sources.list.d/falcosecurity.list
apt-get update && apt-get install -y falco
3. התקנת מכולות ואורקסטרציה
אופטימיזציית Kubernetes
# קטע מניואנס K8s לרמת ייצור
apiVersion: apps/v1
kind: Deployment
spec:
template:
spec:
containers:
- name: app
resources:
limits:
cpu: "2"
memory: "4Gi"
requests:
cpu: "1"
memory: "2Gi"
topologySpreadConstraints:
- maxSkew: 1
topologyKey: kubernetes.io/hostname
whenUnsatisfiable: ScheduleAnyway
הגדרת רשת שירותים (Service Mesh)
# הגדרות מותאמות של Istio
istioctl install --set profile=default \
--set values.global.proxy.resources.limits.cpu=2000m \
--set values.global.proxy.resources.limits.memory=1024Mi
4. אינטגרציית CI/CD
תהליך עבודה של GitOps
// דוגמת Jenkinsfile לפריסות ללא השבתה
pipeline {
stages {
stage('Deploy') {
steps {
sh 'kubectl apply -f k8s/ --prune -l app=myapp'
timeout(time: 15, unit: 'MINUTES') {
input message: 'לאשר הפקה?'
}
}
}
}
post {
failure {
slackSend channel: '#alerts', message: "Build ${currentBuild.number} נכשל!"
}
}
}
5. פריסת מערכת ניטור
מערכת תצפית
# ערכת Prometheus + Grafana + Loki version: '3' services: prometheus: image: prom/prometheus:v2.40.0 command: - '--config.file=/etc/prometheus/prometheus.yml' volumes: - ./prometheus.yml:/etc/prometheus/prometheus.yml grafana: image: grafana/grafana:9.3.2 ports: - "3000:3000"
איסוף מדדים מותאמים אישית
# דוגמת ייצואן Python למדדי עסק מותאמים אישית
from prometheus_client import start_http_server, Gauge
import random
REQUEST_LATENCY = Gauge('app_request_latency', 'שהיית אפליקציה במילישניות')
if __name__ == '__main__':
start_http_server(8000)
while True:
REQUEST_LATENCY.set(random.randint(1, 100))
6. פרוטוקולי התאוששות מאסון
בדיקת failover אוטומטית
# סקריפט הנדסת כאוס
#!/bin/bash
# סיום אקראי של nodes לבדיקת עמידות
NODES=$(kubectl get nodes -o jsonpath='{.items[*].metadata.name}')
TARGET=$(shuf -e -n1 $NODES)
echo "מסיים node $TARGET"
gcloud compute instances delete $TARGET --zone=us-central1-a
7. הרחבות Edge Computing
כללי CDN מתקדמים
// סקריפט Cloudflare Workers ללוגיקת edge
addEventListener('fetch', event => {
event.respondWith(handleRequest(event.request))
})
async function handleRequest(request) {
const url = new URL(request.url)
if (url.pathname.startsWith('/api/')) {
return new Response('חסום בקצה', { status: 403 })
}
return fetch(request)
}
8. אסטרטגיות אופטימיזציית עלויות
אוטומציה של Spot Instance
# קונפיגורציית AWS Spot Fleet resource "aws_spot_fleet_request" "workers" { iam_fleet_role = "arn:aws:iam::123456789012:role/spot-fleet" target_capacity = 10 allocation_strategy = "diversified" launch_specification { instance_type = "m5.large" ami = "ami-123456" spot_price = "0.05" } }