!!!###!!!title=图表智能生成——VisActor/VMind 教程文档!!!###!!!!!!###!!!description=本教程将向你详细介绍VMind中的图表智能生成功能,并提供一些示例。生成图表的方式有很多,比如你可以在PowerBI、Tableau等专业的BI可视化工具中,利用数据集的字段来制作可视化图表;或者你也可以直接使用VChart、ECharts、MatPlotlib等图表库,通过编写代码来绘制图表。此外,VChart、Echarts等图表库还提供了简单易用的图表编辑器,用户可以上传数据并进行图表制作。然而,传统的图表生成方式也存在一些问题:- 对于编程新手来说,他们可能不会编写代码,也就无法使用图表库来生成图表。- 图表类型繁多,用户展示数据的目的各不相同,这就导致了适合展示的图表类型和对应的字段映射也会有所不同。对于非专业用户来说,他们可能无法准确地选择出最能表达自己观点的图表类型。![](https://lf9-dp-fe-cms-tos.byteorg.com/obj/bit-cloud/vmind/tutorials/VMind_chart_generation.png)- 用户对于图表样式、动画的需求各不相同,往往需要一定的设计能力才能满足。设计出令人眼前一亮的图表并不容易,它需要设计技能和审美意识,而这些是许多用户所缺乏的。这些问题增加了数据可视化的创作门槛,阻碍了非专业用户创作符合自己意图的可视化作品。VMind的解决方案是,利用大语言模型的自然语言理解能力和公域知识,根据用户的数据和展示意图,推荐合适的图表类型,并将字段映射到合适的视觉通道上,实现图表的智能生成,从而降低用户进行数据可视化的门槛。!!!###!!!

图表生成

本教程将向你详细介绍VMind中的图表智能生成功能,并提供一些示例。

生成图表的方式有很多,比如你可以在PowerBI、Tableau等专业的BI可视化工具中,利用数据集的字段来制作可视化图表;或者你也可以直接使用VChart、ECharts、MatPlotlib等图表库,通过编写代码来绘制图表。此外,VChart、Echarts等图表库还提供了简单易用的图表编辑器,用户可以上传数据并进行图表制作。

然而,传统的图表生成方式也存在一些问题:

  • 对于编程新手来说,他们可能不会编写代码,也就无法使用图表库来生成图表。
  • 图表类型繁多,用户展示数据的目的各不相同,这就导致了适合展示的图表类型和对应的字段映射也会有所不同。对于非专业用户来说,他们可能无法准确地选择出最能表达自己观点的图表类型。
  • 用户对于图表样式、动画的需求各不相同,往往需要一定的设计能力才能满足。设计出令人眼前一亮的图表并不容易,它需要设计技能和审美意识,而这些是许多用户所缺乏的。

这些问题增加了数据可视化的创作门槛,阻碍了非专业用户创作符合自己意图的可视化作品。

VMind的解决方案是,利用大语言模型的自然语言理解能力和公域知识,根据用户的数据和展示意图,推荐合适的图表类型,并将字段映射到合适的视觉通道上,实现图表的智能生成,从而降低用户进行数据可视化的门槛。

generateChart

VMind的generateChart函数是一个强大的工具,它可以帮助你智能生成图表。这个函数需要以下几个参数:

  • userPrompt (string): 用户的可视化意图(你想用图表展示什么信息)

  • fieldInfo (Array): 数据集中字段的信息,包括字段名称,类型等

  • dataset (Array): 图表中使用的原始数据集,可以是undefined。若dataset为undefined,则会生成一个spec模板,后续可以调用fillSpecTemplateWithData将数据填充到spec模板。

  • options: 可选,选项参数,包括以下内容:

    • chartTypeList (ChartType[],可选): 支持的图表类型列表。若不为undefined,则会从该列表指定的图表类型中选择生成。
    • enableDataQuery (boolean, 可选): 决定是否在图表生成过程中开启数据聚合
    • colorPalette (Array, 可选): 用于设置图表的调色板
    • animationDuration (number, 可选): 用于设置图表动画的播放持续时间
    • theme (ChartTheme | string, 可选): 设置最终sepc的主题样式,默认为空,VMind会默认使用带渐变颜色的主题样式,可以设置 VChart 通用深浅主题('light' | 'dark')或者符合你使用场景下的主题样式

这个方法会返回一个VChart图表spec

📢 请注意:generateChart方法会将userPrompt和fieldInfo传递给大语言模型用于生成图表,但是dataset中的详细数据并不会被传递。

在生成图表的过程中,VMind首先会利用大语言模型,根据userPrompt和fieldInfo,推荐一个适合的图表类型。然后,它会将fieldInfo中的字段映射到图表的x轴、y轴、颜色、尺寸等视觉通道上。

VMind默认会为生成的图表添加入场动画,因此它还会返回图表动画的时长time。如果你不想要图表动画,可以将spec.animation设为false。

你可以在VChart动画教程中了解更多关于图表动画的信息。

下面是一个使用generateChart生成图表的例子:

import VMind from '@visactor/vmind';

const vmind = new VMind(options)
const userPrompt = 'show me the changes in sales rankings of various car brand';
const { spec, time } = await vmind.generateChart(userPrompt, fieldInfo, dataset);

你可以在创建VMind实例中了解如何创建VMind实例和options中的参数信息,在数据格式与数据处理章节中获取更多关于fieldInfo和dataset的相关信息。

你可以对spec进行二次加工,改变图表的颜色、样式、动画等配置,也可以直接渲染VChart图表:

<body>
<!-- Prepare a DOM with size (width and height) for vchart, of course you can also specify it in the spec configuration -->
<div id="chart" style="width: 600px;height:400px;"></div>
</body>
import VChart from '@visactor/vchart';

// Create vchart instance
const vchart = new VChart(spec, { dom: 'chart' });
// Render Chart
vchart.renderSync();

在userPrompt中,你可以描述你想展示的内容,这将作为大语言模型推荐图表类型时的依据;你也可以通过options.colorPalette传入一个颜色字符串数组,它将被用作图表的颜色主题。

参数详解

userPrompt

userPrompt参数是你用来描述你想要用数据集展示的内容,这个描述会被传递给大语言模型,作为生成图表时的参考依据。

举个例子,假设我们有一个手机品牌销售数据集,如下所示:

[
    {
        "品牌名称": "Apple",
        "市场份额": 0.5,
        "平均价格": 7068,
        "净利润": 314531
    },
    {
        "品牌名称": "Samsung",
        "市场份额": 0.2,
        "平均价格": 6059,
        "净利润": 362345
    },
    {
        "品牌名称": "Vivo",
        "市场份额": 0.05,
        "平均价格": 3406,
        "净利润": 234512
    },
    {
        "品牌名称": "Nokia",
        "市场份额": 0.01,
        "平均价格": 1064,
        "净利润": -1345
    },
    {
        "品牌名称": "Xiaomi",
        "市场份额": 0.1,
        "平均价格": 4087,
        "净利润": 131345
    }
]

你可以将userPrompt设置为展示各品牌市场占有率,然后调用generateChart方法,这样就会生成一个饼图:

你也可以设置userPrompt展示各品牌的净利润,这样生成的图表就会展示各品牌的净利润情况:

你还可以指定图表类型,比如设置userPrompt展示各品牌的净利润,用折线图,这样生成的图表就会是一个折线图:

你甚至可以指定图表视觉通道的映射,例如设置userPrompt使用平均价格做x轴,净利润做y轴,品牌名称用作颜色,市场份额做点的大小,绘制散点图

VMind的强大之处在于,你只需要用一句话描述你的需求,就可以生成你想要的图表,而无需关心图表生成的细节。这得益于大语言模型所掌握的公域知识。

例如,对于下面这份csv数据:

时间,男-早餐,女-早餐
周一,15,22
周二,12,10
周三,15,20
周四,10,12
周五,13,15
周六,10,15
周日,12,14

如果你输入的展示意图为展示男女早餐饭量不同,那么就会生成一个双轴图:

VMind还支持动态条形图(ranking bar),这是一种叙事图表,它通过不断变化的柱状图展示不同时间节点不同种类的数据在排名上的变化。为了生成一个动态条形图,数据中必须有一个时间字段。

例如,我们有下面的数据集和字段信息:

[
    {
        "country": "USA",
        "continent": "North America",
        "GDP": 239270,
        "year": 1973
    },
    {
        "country": "India",
        "continent": "Asia",
        "GDP": 22960,
        "year": 1973
    },
    {
        "country": "South Korea",
        "continent": "Asia",
        "GDP": 7870,
        "year": 1973
    },
    {
        "country": "Indonesia",
        "continent": "Asia",
        "GDP": 10980,
        "year": 1973
    },
    {
        "country": "Saudi Arabia",
        "continent": "Asia",
        "GDP": 23760,
        "year": 1973
    },
    {
        "country": "Thailand",
        "continent": "Asia",
        "GDP": 4130,
        "year": 1973
    },
    {
        "country": "Philippines",
        "continent": "Asia",
        "GDP": 5660,
        "year": 1974
    },
    {
        "country": "Malaysia",
        "continent": "Asia",
        "GDP": 2780,
        "year": 1974
    },
    {
        "country": "United Kingdom",
        "continent": "Europe",
        "GDP": 114750,
        "year": 1974,
    }
    ...... //完整数据集请见VMind仓库中的packages/vmind/__tests__/browser/src/constants/mockData.ts文件
]
[
    {
        "fieldName": "country",
        "type": "string",
        "role": "dimension"
    },
    {
        "fieldName": "continent",
        "type": "string",
        "role": "dimension"
    },
    {
        "fieldName": "GDP",
        "type": "float",
        "role": "measure"
    },
    {
        "fieldName": "year",
        "type": "date",
        "role": "measure"
    }
]

如果userPromptShow me the change of the GDP rankings of each country,那么就会生成一个动态条形图:

为了让VMind生成符合预期的图表,你需要在userPrompt中尽可能清晰地描述你的展示意图和目的。此外,你还需要确保数据集的字段名称具有一定的语义,或者在字段信息中添加字段描述,具体请参见数据格式与数据处理章节。

User Prompt 为空

如果我有一个图表,在不进行人工意图的输入下,即没有userPrompt的输入情况下,我可以得到一个较好的图表生成结果吗? 答案是,yes! 目前 VMind 支持在没有用户意图的情况下,根据公域知识以及字段的信息内容,去产生一个用户最可能想要在这个数据上进行呈现的图表内容。同样与前文,这需要数据中的数据信息和字段信息尽可能的详细和完整,设想如果我的数据每个字段的名称和描述都为'a' | 'b' | 'c'这样的内容,显然无法产生一个高质量的图表,这个数据本身也没有特别的意义,因为我们并不了解其中的字段到底代表了什么含义。

同样以前文的手机品牌销售额数据集作为测试,当我们不传入userPrompt时,结果如下所示

options

enableDataQuery: 是否开启智能数据聚合

数据聚合章节中,我们已经介绍过,为了满足展示销售额最多的10个部门展示北方区域各商品的销售额等图表展示需求,我们需要先对数据进行聚合,然后再生成图表。在默认情况下,generateChart函数会在执行过程中调用一次dataQuery,使用相同的userPromptfieldInfodataset对数据进行聚合,然后使用聚合后的数据完成后续的图表生成步骤。

然而,如果你确定你的数据无需进行进一步的聚合、筛选和排序就可以满足用户的图表展示需求,你可以通过将enableDataQuery设置为false来关闭这一流程:

import VMind from '@visactor/vmind';

const vmind = new VMind(options)
const userPrompt = 'show me the changes in sales rankings of various car brand';
const { spec, time } = await vmind.generateChart(userPrompt, fieldInfo, dataset, {enableDataQuery: false}); //将enableDataQuery设置为false,关闭数据聚合

这样做可以减少一次调用大模型的过程,降低token消耗,提高图表生成速度。关于VMind数据聚合的更多信息,请参考数据聚合章节。

chartTypeList: 限制VMind生成的图表类型

VMind目前支持VChart中常见的25种图表类型:

根据userPromptfieldInfo的不同,这些图表类型都有可能被大语言模型推荐。 如果你有新的图表类型需求,欢迎在我们的Github页面提出。

如果你想限制VMind在图表智能生成中生成的图表类型,可以通过设置options.chartTypeList数组:

import VMind, { ChartType } from '@visactor/vmind';

//限制生成以下几种图表类型:柱状图,折线图,散点图,饼图,词云
const chartTypeList = [
  ChartType.BarChart,
  ChartType.LineChart,
  ChartType.ScatterPlot,
  ChartType.PieChart,
  ChartType.WordCloud
  ]

const { spec } = await vmind.generateChart(userPrompt, fieldInfo, dataset, {chartTypeList});

在上面的例子中,VMind将会在柱状图,折线图,散点图,饼图,词云中选择图表类型进行生成。若用户在userPrompt强行指定了不支持的图表类型,将会抛出错误。

colorPalette: 设置图表色板

可以通过将options.colorPalette设置为一个颜色数组来指定图表所使用的色板:

//设置自定义色板
const colorPalette = ['#1f77b4', '#ff7f0e', '#2ca02c', '#d62728', '#9467bd', '#8c564b', '#e377c2', '#7f7f7f', '#bcbd22', '#17becf'];

const { spec } = await vmind.generateChart(userPrompt, fieldInfo, dataset, {colorPalette});

同时,VMind还内置了Arco-designSemi-design源力设计等多套主题色板:

import VMind, {ArcoTheme} from '@visactor/vmind';

//使用Arco-design色板
const {spec} = await vmind.generateChart(describe, finalFieldInfo, finalDataset, {
  colorPalette: ArcoTheme.colorScheme
});
import VMind, { VeOThemeFinance } from '@visactor/vmind';

//使用源力设计-金融行业主题色板
const {spec} = await vmind.generateChart(describe, finalFieldInfo, finalDataset, {
  colorPalette: VeOThemeFinance.colorScheme
});

更多主题色板参见图表智能生成API

返回值详解

vmind.generateChart方法返回值类型定义如下:

interface GenerateChartResult {
  /** 图表spec */
  spec: Record<string, any>;
  /** 图表类型*/
  chartType: ChartType;
  /** 最终的视觉通道映射  */
  cell: Cell;
  /** token 消耗量 */
  usage: Usage;
  /* 生成当前图表的具体指令,在user prompt的情况下跟user prompt一致 */
  command: string;
  /** 转唯gif/video时所用的配置时间 *//
  time: {
    totalTime : number;
    frameArr: number[];
  };
  /** 基于规则的图表推荐结果,在手动设置规则或者大模型生成有误情况下产生 */
  chartAdvistorRes: {
    /** 图表spec */
    spec: Record<string, any>;
    /** 图表类型*/
    chartType: ChartType;
    /** 推荐得分 */
    score: number
  }[]
}

spec

生成的VChart图表spec。若dataset为空,则为不包含数据的spec模板

chartType

生成的图表类型,参见本教程的chartTypeList: 限制VMind生成的图表类型章节

cell

图表中的字段映射,描述数据集中的字段如何映射到图表的各个视觉通道上。视觉通道(Visual Channel)是数据可视化中的一个重要概念,用于描述如何将数据的属性映射到视觉元素,以便人类直观理解。常见的视觉通道包括颜色、形状、大小、方位、位置等。例如,通过视觉通道,我们可以将数据集中的不同类别映射到不同颜色的图形,或者将数值大小映射到图形的大小,从而帮助我们快速理解数据的特性和分布。

下面展示一个图表生成的例子:

import VMind from '@visactor/vmind';

const vmind = new VMind(options)

const userPrompt = '展示不同地区商品销售额';
const fieldInfo=[
    {
        "fieldName": "商品名称",
        "type": "string",
        "role": "dimension",
        "domain": [
            "可乐",
            "雪碧",
            "芬达",
            "醒目"
        ]
    },
    {
        "fieldName": "region",
        "type": "string",
        "role": "dimension",
        "domain": [
            "south",
            "east",
            "west",
            "north"
        ]
    },
    {
        "fieldName": "销售额",
        "type": "int",
        "role": "measure",
        "domain": [
            28,
            2350
        ]
    }
]

const dataset=[
    {
        "商品名称": "Coke",
        "region": "south",
        "销售额": 2350
    },
    {
        "商品名称": "Coke",
        "region": "east",
        "销售额": 1027
    },
    {
        "商品名称": "Coke",
        "region": "west",
        "销售额": 1027
    },
    {
        "商品名称": "Coke",
        "region": "north",
        "销售额": 1027
    },
    ...
]
const { chartType, spec, cell } = await vmind.generateChart(userPrompt, fieldInfo, dataset);
console.log(cell)

在这个例子中,生成了一个柱状图:

其cell如下:

{
  "x": "商品名称",
  "y": "销售额",
  "color": "region"
}

这表示VMind将商品名称字段映射到图表的x轴,销售额字段映射到y轴,region字段映射到柱子的颜色上。

chartAdvistorRes

该结果是根据当前数据和字段信息,通过VMind的内置规则推导得到的图表推荐结果,在设置模型为Model.CHART_ADVISOR或者用户的大模型设置有误,无法获取结果时兜底产生。详见:基于规则的图表生成

生成spec模板

在没有具体数据集、仅有数据字段的情况下,我们也可能需要生成图表。比如,在进行查询之前,我们可以根据数据集中的字段先生成一个图表,之后依据图表的类型和含有的字段执行相关查询。在这种情况下,调用generateChart方法时无需传入具体的数据集,而是先产生一个spec模板,后续再通过fillSpecWithData方法获取最终用于图表渲染的spec。

下面展示如何使用generateChart方法生成一个spec模板:

import VMind from '@visactor/vmind';

const vmind = new VMind(options)

const userPrompt = '展示不同地区商品销售额';
const fieldInfo=[
    {
        "fieldName": "商品名称",
        "type": "string",
        "role": "dimension",
        "domain": [
            "可乐",
            "雪碧",
            "芬达",
            "醒目"
        ]
    },
    {
        "fieldName": "region",
        "type": "string",
        "role": "dimension",
        "domain": [
            "south",
            "east",
            "west",
            "north"
        ]
    },
    {
        "fieldName": "销售额",
        "type": "int",
        "role": "measure",
        "domain": [
            28,
            2350
        ]
    }
]
//不传入dataset,生成spec模板
const { chartType, spec, cell } = await vmind.generateChart(userPrompt, fieldInfo);

此时我们已经得到了VMind生成的图表spec、字段映射cell和图表类型chartType。随后我们调用fillSpecWithData方法,向spec模板中填入数据:

//向模板中填入数据
const dataset=[
    {
        "商品名称": "Coke",
        "region": "south",
        "销售额": 2350
    },
    {
        "商品名称": "Coke",
        "region": "east",
        "销售额": 1027
    },
    {
        "商品名称": "Coke",
        "region": "west",
        "销售额": 1027
    },
    {
        "商品名称": "Coke",
        "region": "north",
        "销售额": 1027
    },
    ...
]

const spec = vmind.fillSpecWithData(spec, dataset)

最终生成的spec可以用于渲染VChart图表。