百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

【Google Gemini极简教程】使用Flask和Gemini API构建一个AI BaaS

ccwgpt 2025-06-13 11:48 16 浏览 0 评论

BaaS(Backend as a Service,后端即服务)

BaaS 是一种云服务模型,它为开发者提供了一种便捷的方式来构建和管理应用程序的后端服务。BaaS 提供了一系列的后端功能,如数据库管理、用户认证、文件存储、推送通知等,而开发者无需从头开始编写这些功能的代码。通过使用 BaaS,开发者可以专注于前端开发和业务逻辑,从而加快应用程序的开发速度。

Flask

Flask是一个基于Python的开源web框架,它使用WSGI协议,并支持多种模板引擎,并且支持RESTful API开发,使用起来非常方便,Java程序员可以把Flask当成Python版本的SpringBoot。

Google Gemini

Google Gemini支持免费试用,如果请求频率不高,没有问题(我本地测试过)。并且Gemini支持多模态模型,可以实现文生图和图像识别,以及音频,视频处理。

使用的时候可以在Colab中运行(Colab中运行可以免费使用Gemini,但是经过我自己本地运行测试,也可以免费使用,只要访问频率不高应该都没问题),下面讲下怎么在本地运行实现。

实现步骤

1.先安装依赖包:包括Flask和Gemini的

pip install -U -q 'google-genai'
pip install Flask
pip install flask-cors

2.申请gemini key:

https://aistudio.google.com/app/apikey

右上角创建API密钥即可。

3.最简单的代码:先写一个最简单的例子,只涉及到gemini的调用,直接对话,使用的时候把api key填写上自己申请的。

from google import genai
from google.genai import types
client = genai.Client(api_key="换成自己的key")
#可以更换别的gemini系列模型
model = 'gemini-2.0-flash'
# model = 'gemini-2.0-flash-lite'
# model = 'gemini-2.5-pro-exp-03-25'
response = client.models.generate_content(
    model=model,
    contents='你是谁'
)
print(response.text) #一次性回答

4.流式回答:一个字一个字回答,回答较多时用这种方式比较好,同样记得换key

from google import genai
client = genai.Client(api_key="xxxxxxxxxxxx")
for chunk in client.models.generate_content_stream(
    model='gemini-2.0-flash-lite',
    contents="你是谁"
):
    print(chunk.text)

有了基础的demo,就可以套用Flask做一个基于AI的BaaS了。

5.用Flask做一个post的接口,然后在接口里把我们调用gemini的代码拷贝进去,基本就行了。先看直接对话的,在接口测试工具比如postman里测试一下。日志输出和返回都正常。

完整代码:

from flask import Flask, jsonify, request
from google import genai
from google.genai import types
app = Flask(__name__)
client = genai.Client(api_key="xxxxxxxxxxxxxx")
# model = 'gemini-2.0-flash'
model = 'gemini-2.0-flash-lite'
# model = 'gemini-2.5-pro-exp-03-25'
@app.route('/query', methods=['POST'])
def query():
    data = request.get_json()
    prompt = data.get('prompt')
    print(prompt)
    response = client.models.generate_content(
        model=model,
        contents=prompt
    )
    result = response.text
    print(result)
    return jsonify({'result': result}), 200
if __name__ == '__main__':
    app.run(debug=True)

请求的url就是 localhost:5000/query 方法是 post

注意这只是一个极简示例,实际使用key不要写在代码里。我这里query接口参数是用json格式传的,可以根据自己的情况换成其他方式,比如form表单提交参数或者get传参等。使用的时候gemini有很多模型,可以指定用哪个模型。

6.再看一个页面请求流式对话的,实际使用过中这种场景比较多见。在AI回答内容比较多的时候如果不使用流式响应,客户端可能因为等待超时而不能显示完整答案,因此需要使用流式响应,即每次只返回一部分答案,然后客户端可以实时显示,这样用户体验会更好。

看效果,分别在接口测试工具和html页面上发起请求。后台Flask接口改为支持stream响应。因为是本地的html页面,所以要开启flask的跨域支持。这次把接口改为get传参。

完整python和html代码:

from flask import Flask, jsonify, request,Response
from flask_cors import CORS  # 导入 CORS 模块
from google import genai
from google.genai import types
app = Flask(__name__)
# 更严格的 CORS 配置(允许 POST 和 SSE)
CORS(app, resources={
    r"/streamquery": {
        "origins": "*",  # 允许所有域名(生产环境应替换为你的前端域名)
        "methods": ["GET", "POST"],  # 允许的 HTTP 方法
        "expose_headers": ["Content-Type"]  # 允许前端访问的响应头
    }
})
client = genai.Client(api_key="xxxxxxx")
# model = 'gemini-2.0-flash'
model = 'gemini-2.0-flash-lite'
# model = 'gemini-2.5-pro-exp-03-25'
@app.route('/streamquery', methods=['GET'])
def query():
    prompt = request.args.get('prompt', default='', type=str)
    print(prompt)
    # 流式生成响应
    def generate():
        response = client.models.generate_content_stream(
            model='gemini-2.0-flash-lite',
            contents=prompt)
        for chunk in response:
            yield f"data: {chunk.text}\n"  # SSE 格式
    # 返回 Server-Sent Events (SSE) 流
    return Response(generate(), mimetype='text/event-stream')
if __name__ == '__main__':
    app.run(debug=True)
<script>
    const eventSource = new EventSource(
      'http://127.0.0.1:5000/streamquery?prompt=讲个笑话');
  
    eventSource.onmessage = (event) => {
      console.log(event.data);  // 实时打印流式结果
      document.getElementById('output').innerHTML += event.data;
    };
    // 错误处理
    eventSource.onerror = (err) => {
      eventSource.close();
    };
  </script>
  <div id="output"></div>

通过这2个例子,我们其实已经能够利用flask和gemini实现一个AI后台服务了。当然可以把接口换成其他语言实现,比如java或者php,原理都是一样的。

关注AI实用工具和技巧,关注后台私信免费进知识星球:

相关推荐

自己动手写Android数据库框架_android开发数据库搭建

http://blog.csdn.net/feiduclear_up/article/details/50557590推荐理由关于Android数据库操作,由于每次都要自己写数据库操作,每次还得去...

谷歌开源大模型评测工具LMEval,打通谷歌、OpenAI、Anthropic

智东西编译|金碧辉编辑|程茜智东西5月28日消息,据科技媒体TheDecoder5月26日报道,当天,谷歌正式发布开源大模型评测框架LMEval,支持对GPT-4o、Claude3.7...

工信部:着力推动大模型算法、框架等基础性原创性的技术突破

工信部新闻发言人今日在发布会上表示,下一步,我们将坚持突出重点领域,大力推动制造业数字化转型,推动人工智能创新应用。主要从以下四个方面着力。一是夯实人工智能技术底座。通过科技创新重大项目,着力推动大模...

乒乓反复纠结“框架不稳定”的三个小误区

很多球友由于对框架的认知不清晰,往往会把“框架不稳定”当成一种心理负担,从而影响学球进度,其典型状态就是训练中有模有样,一旦进入实战,就像被捆住了手脚。通过训练和学习,结合“基本功打卡群”球友们交流发...

前AMD、英特尔显卡架构师Raja再战GPU,号称要全面重构堆栈

IT之家8月5日消息,知名GPU架构师拉贾科杜里(RajaKoduri)此前曾先后在AMD和英特尔的显卡部门担任要职。而在今日,由Raja创立的GPU软件与IP初创企...

三种必须掌握的嵌入式开发程序架构

前言在嵌入式软件开发,包括单片机开发中,软件架构对于开发人员是一个必须认真考虑的问题。软件架构对于系统整体的稳定性和可靠性是非常重要的,一个合适的软件架构不仅结构清晰,并且便于开发。我相...

怪不得别人3秒就知道软考案例怎么做能50+

软考高级统一合格标准必须三科都达到45分,案例分析也一直是考生头疼的一门,但是掌握到得分点,案例能不能50+还不是你们说了算吗?今天就结合架构案例考点,分享实用的备考攻略~一、吃透考点,搭建知识框架从...

UML统一建模常用图有哪些,各自的作用是什么?一篇文章彻底讲透

10万+爆款解析:9大UML图实战案例,小白也能秒懂!为什么需要UML?UML(统一建模语言)是软件开发的“蓝图”,用图形化语言描述系统结构、行为和交互,让复杂需求一目了然。它能:降低沟通成本避...

勒索软件转向云原生架构,直指备份基础设施

勒索软件组织和其他网络犯罪分子正越来越多地将目标对准基于云的备份系统,对久已确立的灾难恢复方法构成了挑战。谷歌安全研究人员在一份关于云安全威胁演变的报告中警告称,随着攻击者不断改进数据窃取、身份泄露和...

ConceptDraw DIAGRAM:释放创意,绘就高效办公新未来

在当今数字化时代,可视化工具已成为提升工作效率和激发创意的关键。ConceptDrawDIAGRAM,作为一款世界顶级的商业绘图软件,凭借其强大的功能和用户友好的界面,正逐渐成为众多专业人士的首选绘...

APP 制作界面设计教程:一步到位_app界面设计模板一套

想让APP界面设计高效落地,无需繁琐流程,掌握“框架搭建—细节填充—体验优化”三步法,即可一步到位完成专业级设计。黄金框架搭建是基础。采用“三三制布局”:将屏幕横向三等分,纵向保留三...

MCP 的工作原理:关键组件_mcp部件

以下是MCP架构的关键组件:MCP主机:像ClaudeDesktop、GitHubCopilot或旅行助手这样的AI智能体,它们希望通过MCP协议访问工具、资源等。MCP主机会...

软件架构_软件架构师工资一般多少

软件架构师自身需要是程序员,并且必须一直坚持做一线程序员。软件架构应该是能力最强的一群程序员,他们通常会在自身承接编程任务的同时,逐渐引导整个团队向一个能够最大化生产力的系统设计方向前进。软件系统的架...

不知不觉将手机字体调大!老花眼是因为“老了吗”?

现在不管是联系、交友,还是购物,都离不开手机。中老年人使用手机的时间也在逐渐加长,刷抖音、看短视频、发朋友圈……看手机的同时,人们也不得不面对“视力危机”——老花眼,习惯眯眼看、凑近看、瞪眼看,不少人...

8000通用汉字学习系列讲座(第046讲)

[表声母字]加(续)[从声汉字]伽茄泇迦枷痂袈笳嘉驾架咖贺瘸(计14字)嘉[正音]标准音读jiā。[辨形]上下结构,十四画。会意形声字,从壴从加,加也表声。注:从壴,字义与鼓乐有关;从加,字义与...

取消回复欢迎 发表评论: