PostgresML 基于 PostgreSQL 的 AI 应用数据库

2023年 12月 8日 18.3k 0

PostgresML是PostgreSQL的机器学习扩展,能让你使用SQL查询对文本和表格数据进行训练和推理。有了PostgresML,你可以将机器学习模型无缝集成到PostgreSQL数据库中,并利用尖端算法的强大功能高效处理数据。

  • 执行自然语言处理任务,如情感分析、提问和回答、翻译、总结和文本生成
  • 从 HuggingFace 模型 Hub 访问数千种最先进的语言模型,如 GPT-2、GPT-J 和 GPT-Neo
  • 针对不同任务,在自己的文本数据上微调大型语言模型
  • 将现有的 PostgreSQL 数据库用作向量数据库,从存储在数据库中的文本生成 embedding

针对文本数据操作:

翻译

SQL 查询

SELECT pgml.transform(
    'translation_en_to_fr',
    inputs => ARRAY[
        'Welcome to the future!',
        'Where have you been all this time?'
    ]
) AS french;

结果

 

                         french                                 
------------------------------------------------------------

[
    {"translation_text": "Bienvenue à l'avenir!"},
    {"translation_text": "Où êtes-vous allé tout ce temps?"}
]

情感分析 SQL 查询

 

SELECT pgml.transform(
    task   => 'text-classification',
    inputs => ARRAY[
        'I love how amazingly simple ML has become!', 
        'I hate doing mundane and thankless tasks. ☹️'
    ]
) AS positivity;

结果

 

                    positivity
------------------------------------------------------
[
    {"label": "POSITIVE", "score": 0.9995759129524232}, 
    {"label": "NEGATIVE", "score": 0.9903519749641418}
]

针对表格数据操作:

  • 47+ 种分类和回归算法
  • 推理速度比基于 HTTP 的模型服务快 8 - 40 倍
  • 每秒数百万次事务
  • 横向可扩展性

训练分类模型

训练

SELECT * FROM pgml.train(
    'Handwritten Digit Image Classifier',
    algorithm => 'xgboost',
    'classification',
    'pgml.digits',
    'target'
);

推理

 

SELECT pgml.predict(
    'My Classification Project', 
    ARRAY[0.1, 2.0, 5.0]
) AS prediction;

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论