feat: support gpt-4o image generation (#4054)

* feat: support gpt-4o image generation * clean code
2025-03-29 07:18:42 +08:00 · 2025-03-29 07:18:42 +08:00 · 194ba1baa0
commit 194ba1baa0
parent 53ae427f2f
5 changed files with 59 additions and 2 deletions
--- a/src/renderer/src/providers/GeminiProvider.ts
+++ b/src/renderer/src/providers/GeminiProvider.ts
@ -731,6 +731,7 @@ export default class GeminiProvider extends BaseProvider {
    onChunk({
      text,
      generateImage: {
        type: 'base64',
        images
      },
      usage: {
--- a/src/renderer/src/providers/OpenAIProvider.ts
+++ b/src/renderer/src/providers/OpenAIProvider.ts
@ -27,6 +27,7 @@ import {
  Suggestion
 } from '@renderer/types'
 import { removeSpecialCharactersForTopicName } from '@renderer/utils'
 import { addImageFileToContents } from '@renderer/utils/formats'
 import {
  callMCPTool,
  mcpToolsToOpenAITools,
@ -354,7 +355,7 @@ export default class OpenAIProvider extends BaseProvider {
    const defaultModel = getDefaultModel()
    const model = assistant.model || defaultModel
    const { contextCount, maxTokens, streamOutput } = getAssistantSettings(assistant)
-
+    messages = addImageFileToContents(messages)
    let systemMessage = assistant.prompt ? { role: 'system', content: assistant.prompt } : undefined
    if (isOpenAIoSeries(model)) {
--- a/src/renderer/src/services/ApiService.ts
+++ b/src/renderer/src/services/ApiService.ts
@ -5,6 +5,7 @@ import store from '@renderer/store'
 import { setGenerating } from '@renderer/store/runtime'
 import { Assistant, MCPTool, Message, Model, Provider, Suggestion } from '@renderer/types'
 import { formatMessageError, isAbortError } from '@renderer/utils/error'
 import { withGenerateImage } from '@renderer/utils/formats'
 import { cloneDeep, findLast, isEmpty } from 'lodash'
 import AiProvider from '../providers/AiProvider'
@ -156,6 +157,7 @@ export async function fetchChatCompletion({
    })
    message.status = 'success'
    message = withGenerateImage(message)
    if (!message.usage || !message?.usage?.completion_tokens) {
      message.usage = await estimateMessagesUsage({
@ -191,7 +193,6 @@ export async function fetchChatCompletion({
  // Reset generating state
  store.dispatch(setGenerating(false))
  return message
 }
--- a/src/renderer/src/types/index.ts
+++ b/src/renderer/src/types/index.ts
@ -308,6 +308,7 @@ export type GenerateImageParams = {
 }
 export type GenerateImageResponse = {
  type: 'url' | 'base64'
  images: string[]
 }
--- a/src/renderer/src/utils/formats.ts
+++ b/src/renderer/src/utils/formats.ts
@ -178,3 +178,56 @@ export function withMessageThought(message: Message) {
  return message
 }
 export function withGenerateImage(message: Message) {
  const imagePattern = new RegExp(`!\\[[^\\]]*\\]\\((.*?)\\s*("(?:.*[^"])")?\\s*\\)`)
  const imageMatches = message.content.match(imagePattern)
  if (!imageMatches || imageMatches[1] === null) {
    return message
  }
  const cleanImgContent = message.content
    .replace(imagePattern, '')
    .replace(/\n\s*\n/g, '\n')
    .trim()
  const downloadPattern = new RegExp(`\\[[^\\]]*\\]\\((.*?)\\s*("(?:.*[^"])")?\\s*\\)`)
  const downloadMatches = cleanImgContent.match(downloadPattern)
  let cleanContent = cleanImgContent
  if (downloadMatches) {
    cleanContent = cleanImgContent
      .replace(downloadPattern, '')
      .replace(/\n\s*\n/g, '\n')
      .trim()
  }
  message = {
    ...message,
    content: cleanContent,
    metadata: {
      ...message.metadata,
      generateImage: {
        type: 'url',
        images: [imageMatches[1]]
      }
    }
  }
  return message
 }
 export function addImageFileToContents(messages: Message[]) {
  const lastAssistantMessage = messages.findLast((m) => m.role === 'assistant')
  if (!lastAssistantMessage || !lastAssistantMessage.metadata || !lastAssistantMessage.metadata.generateImage) {
    return messages
  }
  const imageFiles = lastAssistantMessage.metadata.generateImage.images
  const updatedAssistantMessage = {
    ...lastAssistantMessage,
    images: imageFiles
  }
  return messages.map((message) => (message.role === 'assistant' ? updatedAssistantMessage : message))
 }