1.
作为开发者,你要明确三件事:计费口径、保障方式和测量方法。计费常见为 95th 百分位或按峰值/按固定带宽计费;保障常见为 CIR(承诺带宽)+ 报修 SLA。本段小分段:
1) 确认合同里的计费口径(95th、按量、按峰值或固定端口)。
2) 确认保障内容(带宽/丢包/时延/抖动/SLA 时间窗口)。
3) 要求运营商提供 BGP 社区或优先路由说明(以确保走 CN2 路径到韩端)。
2.
准备可被运营商接受的证据与测试环境:
1) 固定测试服务器(建议在韩国数据中心或云上开一台 VPS,保持公网静态 IP);
2) 本地或国内测试客户端(物理机或同机房服务器);
3) 安装必要工具:iperf3、mtr、tc(Linux),并开启 SNMP 或收集接口流量计数(ifconfig 或 /proc/net/dev)。
命令示例:apt-get install iperf3 mtr iproute2 snmp
3.
使用 iperf3 做长期并发流量测试并记录:
1) 在韩国服务器上运行:iperf3 -s -i 10 --logfile server-iperf.log
2) 在国内客户端运行(单向满载):iperf3 -c
3) 如果需要测反向(韩->中):在客户端加 -R 参数或在韩端作为 client 发起测试。
注意:UDP 测试会产生丢包,可用 iperf3 -u -b 1000M 来探测极限,但尽量先使用 TCP 全并发 (-P) 模式测稳定吞吐。
4.
很多运营商按 5 分钟取样计算 95th 百分位,步骤如下:
1) 每 5 分钟记录一个样本(可以用 SNMP 或脚本读取 ifHCOutOctets);
2) 一个计费周期(通常 30 天)共 N 个样本(30*24*12=8640 个样本);
3) 将所有样本按大小排序,去掉最高的 5%(最大样本的前 5%),剩余的最大值即为 95th 值。
示例快速脚本思路:用 cron 每 5 分钟读取 ifHCOutOctets 并存 CSV,月底用 Python/Excel 排序计算。
5.
要证明运营商未履约,需要有可信日志:
1) 同时收集 iperf3(吞吐)、mtr(路径与逐跳丢包/时延)和接口流量计数的持续日志(建议至少 24-72 小时常态测试);
2) 保留原始时间戳、服务器端/客户端日志、SNMP 接口计数、并截图或导出 CSV;
3) 如果怀疑非 CN2 路由导致问题,使用 traceroute/mtr 多时刻抓取并保留路由跳点;请求运营商提供他们侧的流量镜像或 NetFlow 数据作为佐证。
6.
如果你需要在应用层保证带宽/优先级,可在 Linux 端用 tc 做整形或队列管理:
1) HTB 示例(限制出口 100Mbps):tc qdisc add dev eth0 root handle 1: htb default 12; tc class add dev eth0 parent 1: classid 1:1 htb rate 100mbit; tc class add dev eth0 parent 1:1 classid 1:12 htb rate 100mbit
2) TBF 简单限速:tc qdisc add dev eth0 root tbf rate 100mbit burst 32kbit latency 400ms
3) 对实时业务可结合 dsmark/iptables 标记 DSCP,然后 tc 根据 fwmark 调度优先级。
7.
当检测到问题,按如下流程操作:
1) 立即收集并上传测试日志到云盘,标注时间窗口和影响业务;
2) 提交故障单并附上 iperf/mtr/sflow/SNMP 数据,明确期望(恢复/赔偿/路由切换);
3) 若运营商要求复测,应按他们建议的检测方法复现,并要求运营商同步给出链路端流量快照与社区路由说明;如需仲裁,保留所有原始文件与哈希值以避免争议。
8.
避免误判的要点:
1) 区分机房内部拥堵与运营商链路问题;用跨机房对比测试确认范围;
2) 注意运营商可能只对出口/入方向计费或保障,明确合同条款中“计费方向”;
3) 要求运营商写明 CN2 路由的 BGP 社区与防回流策略,以保证流量确实走的是 CN2 国际到韩国路径。
9.
答:常见计费模式包括 95th 百分位计费、按固定承诺带宽(CIR)计费、按峰值计费和按流量计费。95th 以 5 分钟采样为主,去掉最高 5% 后的最大值作为计费带宽;固定带宽按合同指定的端口速率计费;按流量则按流出/入字节计费。
10.
答:要提供持续、多角度的证据:iperf3 的吞吐日志、mtr 的逐跳丢包与时延、SNMP 或接口字节计数的 5 分钟采样日志、traceroute 路由快照。把这些按时间顺序整理并在故障单中提交,必要时请求运营商给出他们侧的 NetFlow/镜像数据作对比。
11.
答:首先在合同/接入侧确认 CN2 的 BGP 社区与优先路由策略;其次在本端通过 BGP local-preference 或社区打标向上游请求优先出 CN2;第三在应用层用 QoS(DSCP)+ tc 做流量优先级控制;并定期做路由与吞吐测试确保路径稳定。