欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 旅游 > Nginx配置Ollama 访问api服务

Nginx配置Ollama 访问api服务

2025/9/18 14:02:16 来源:https://blog.csdn.net/xianghanscce/article/details/148399944  浏览:    关键词:Nginx配置Ollama 访问api服务

使用Nginx配置Ollama API访问服务指南

一、前置准备
  1. 基础环境要求:

    • 已部署Ollama服务(默认端口11434)
    • 服务器安装Nginx 1.18+版本
    • 有效域名(示例使用api.ollama.service.com)
    • 开放服务器80/443端口
  2. 网络拓扑确认:

    graph LR
    A[客户端] --> B[域名DNS解析]
    B --> C[Nginx服务器]
    C --> D[Ollama服务:11434]
    

二、核心配置解析
server {listen 80;server_name api.ollama.service.com;# 基础路由配置location / {proxy_pass http://IP:11434;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-Proto $scheme;}# 流式API专用配置location /api/ {proxy_pass http://IP:11434;proxy_http_version 1.1;proxy_set_header Connection '';# 实时传输优化proxy_buffering off;proxy_cache off;chunked_transfer_encoding off;# CORS跨域配置add_header 'Access-Control-Allow-Origin' '*' always;add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS' always;# 预检请求处理if ($request_method = 'OPTIONS') {add_header 'Access-Control-Max-Age' 1728000;return 204;}}
}

三、关键配置说明
  1. 流式传输优化组合:

    • proxy_buffering off:禁用响应缓冲
    • proxy_http_version 1.1:启用持久连接
    • chunked_transfer_encoding off:避免分块编码干扰
  2. CORS防护矩阵:

    graph TB
    A[客户端请求] --> B[检测Origin头]
    B --> C{是否预检请求?}
    C -->|是| D[返回OPTIONS响应]
    C -->|否| E[添加CORS响应头]
    
  3. 代理头传递链:

    客户端IP → X-Real-IP → X-Forwarded-For → Ollama服务
    
四、接口测试验证
  1. CORS验证测试:
curl -I -X OPTIONS http://api.ollama.service.com/api/ \
-H 'Origin: http://test-domain.com' \
-H 'Access-Control-Request-Method: POST'

预期响应包含:

HTTP/1.1 204 No Content
Access-Control-Allow-Origin: *
Access-Control-Max-Age: 1728000

  1. 流式请求测试:
async function testStreaming() {const response = await fetch('http://api.ollama.service.com/api/generate', {method: 'POST',headers: {'Content-Type': 'application/json','Authorization': 'Bearer API_KEY'},body: JSON.stringify({model: 'llama2',prompt: '为什么天空是蓝色的?'})});const reader = response.body.getReader();while(true) {const {done, value} = await reader.read();if(done) break;console.log(new TextDecoder().decode(value));}
}
五、性能监控建议
  1. 流量观测指标:

    pie
    title 请求类型分布
    "模型推理" : 65
    "参数调整" : 20
    "状态查询" : 15
    
  2. 推荐监控参数:

    • 连接保持时间:keepalive_timeout
    • 每秒请求数(RPS)
    • 平均响应延迟
六、安全增强建议
  1. 防护措施清单:
    • 启用HTTPS(Let's Encrypt免费证书)
    • 配置请求频率限制
    limit_req_zone $binary_remote_addr zone=ollama_limit:10m rate=10r/s;
    
    • 添加JWT验证层
    • 启用Nginx访问日志审计

本文配置已通过以下环境验证:

  • Ubuntu 22.04 LTS
  • Nginx 1.22.1
  • Ollama 0.1.27
  • 测试工具:curl 7.81.0、Postman v10.14

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词