掌握聚合最新动态了解行业最新趋势
API接口,开发服务,免费咨询服务

计算机视觉工具包Luminoth今日开源

本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载。

GitHub 页面:https://github.com/tryolabs/luminoth

Luminoth 是一个开源的计算机视觉工具包,目前支持目标探测和图像分类,但以后会有更多的扩展。该工具包在 TensorFlow 和 Sonnet 上用 Python 搭建而成。不过,该工具包只具备内部测试版品质,即内部和外部接口(如命令行)非常可能随着代码库的成熟而变化。


下面,我们来看一下 Luminoth 的特点:

开箱使用

Luminoth 是一个开源的工具包,简单易用。

可定制的目标检测和分类模型

使用自定义数据轻松训练神经网络,实现目标检测和分类。使用的是当前最优的模型比如 Faster R-CNN。

在 TensorFlow & Sonnet 上搭建

Luminoth 建立在谷歌深度学习框架 TensorFlow 和 DeepMind 的图形库 Sonnet 上。

训练过程简单

只需要键入 lumi train 就可以训练模型。可以在本地训练,或者使用 Luminoth 内置的谷歌云平台支持在云端训练模型。

训练完成之后,你可以使用 Tensorboard 集成可视化进展和中间结果,还可使用不同的数据分割对模型进行评估。


结果易于理解

可视化结果的能力一直很重要,尤其在计算机视觉领域。在模型训练完之后,使用我们的 UI 或者命令行接口,即可获得容易理解的摘要(summary)和结果的图可视化。

Image

接下来,我们看一下 Luminoth 的安装过程及使用的注意事项。

安装

Luminoth 现在支持 Python 2.7 和 3.4–3.6。

如已安装 TensorFlow 和 Sonnet,Luminoth 将使用已安装的版本。

CPU 支持的安装

只需运行:

$ pip install luminoth

如果你的电脑上没有 TensorFlow 和 Sonnet 的 CPU 版本,则运行以上命令安装这些版本。

GPU 支持的安装

1. 安装 GPU 支持的 TensorFlow(https://www.tensorflow.org/install/)。

2. 安装 GPU 支持的 Sonnet(https://github.com/deepmind/sonnet#installation):

$ pip install dm-sonnet-gpu

 3. 从 PyPI 中安装 Luminoth:

$ pip install luminoth

从数据源安装

首先,将 repo 复制到你的电脑上,然后使用 pip 进行安装:

$ git clone https://github.com/tryolabs/luminoth.git
$ cd luminoth
$ pip install -e .

检查安装是否有效

只需运行 lumi --help。

支持的模型

目前,我们支持以下模型:

  • Object Detection

       Faster R-CNN

我们计划近期增加对更多模型的支持,如 SSD、YOLO 和 Mask R-CNN。此外,我们还致力于在 Pascal VOC2012 等流行数据集上提供预训练的检查点。

使用

运行 lumi 命令时,有一个主要的命令行接口可供使用。如果你对如何操作感到疑惑,只需键入:lumi --help 或 lumi <subcommand> --help,将会出现多个可用选项以及具体描述。

如何处理数据集

详见https://github.com/tryolabs/luminoth/blob/master/docs/DATASETS.md

训练

关于如何在本地训练或在谷歌云中训练,请查看https://github.com/tryolabs/luminoth/blob/master/docs/TRAINING.md

结果可视化

我们试图获取有用、易于理解的摘要和图可视化。我们认为这不仅对于监督是必要的,对于增加对内部运行机制的理解同样大有裨益。这也使代码易于理解、容易学习,计算图也是如此。

摘要和图日志(graph log)的默认存储位置是/tmp/luminoth。你可以运行以下命令来使用 TensorBoard:

tensorboard --logdir /tmp/luminoth

名称来源

黑暗视镜是游戏《银河战士 Prime 2 黑暗回音(Metroid Prime 2: Echoes)》中的一款装备。它由 Luminoth 设计而成,可在与 Ing 的战斗中穿透黑暗 Aether 的烟雾。

License

Copyright © 2017, Tryolabs. Released under the BSD Clause-3.

原文来自:机器之心

声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com

  • Google Gemini Image API

    Nano Banana(gemini-2.5-flash-image 和 gemini-3-pro-image-preview图像模型)是图像生成与编辑的最佳选择,可集成 Nano Banana API,实现高速预览。

    Nano Banana(gemini-2.5-flash-image 和 gemini-3-pro-image-preview图像模型)是图像生成与编辑的最佳选择,可集成 Nano Banana API,实现高速预览。

  • AI文生视频

    支持通过自然语言文本智能生成高质量短视频。用户只需输入一段描述性文字,即可自动合成画面连贯、风格鲜明、配乐匹配的定制化视频内容。适用于短视频创作、广告预演、社交内容生成、游戏素材制作等场景,为开发者与创作者提供高效、灵活、富有想象力的视频生产新范式。

    支持通过自然语言文本智能生成高质量短视频。用户只需输入一段描述性文字,即可自动合成画面连贯、风格鲜明、配乐匹配的定制化视频内容。适用于短视频创作、广告预演、社交内容生成、游戏素材制作等场景,为开发者与创作者提供高效、灵活、富有想象力的视频生产新范式。

  • AI图像理解

    先进的图像理解和分析能力,它能够快速准确地解析和理解图像内容。无论是自然风景、城市建筑还是复杂的场景与活动,都能提供详细的描述和深入的分析。

    先进的图像理解和分析能力,它能够快速准确地解析和理解图像内容。无论是自然风景、城市建筑还是复杂的场景与活动,都能提供详细的描述和深入的分析。

  • AI图像编辑

    根据文本提示(prompt)和图片公网访问链接,编辑原图按照特定风格、场景和氛围感的输出新的图像。广泛应用于电商营销、广告设计、创意灵感等领域,为用户带来高效且个性化的AI图像创作体验。

    根据文本提示(prompt)和图片公网访问链接,编辑原图按照特定风格、场景和氛围感的输出新的图像。广泛应用于电商营销、广告设计、创意灵感等领域,为用户带来高效且个性化的AI图像创作体验。

  • AI图像生成

    根据文本提示(prompt),生成生成具有特定风格、场景和氛围感的图像。广泛应用于电商营销、广告设计、创意灵感等领域,为用户带来高效且个性化的AI图像创作体验。

    根据文本提示(prompt),生成生成具有特定风格、场景和氛围感的图像。广泛应用于电商营销、广告设计、创意灵感等领域,为用户带来高效且个性化的AI图像创作体验。

0512-88869195
客服微信二维码

微信扫码,咨询客服

数 据 驱 动 未 来
Data Drives The Future