本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载。
GitHub 页面:https://github.com/tryolabs/luminoth
Luminoth 是一个开源的计算机视觉工具包,目前支持目标探测和图像分类,但以后会有更多的扩展。该工具包在 TensorFlow 和 Sonnet 上用 Python 搭建而成。不过,该工具包只具备内部测试版品质,即内部和外部接口(如命令行)非常可能随着代码库的成熟而变化。

下面,我们来看一下 Luminoth 的特点:
Luminoth 是一个开源的工具包,简单易用。
使用自定义数据轻松训练神经网络,实现目标检测和分类。使用的是当前最优的模型比如 Faster R-CNN。
Luminoth 建立在谷歌深度学习框架 TensorFlow 和 DeepMind 的图形库 Sonnet 上。
只需要键入 lumi train 就可以训练模型。可以在本地训练,或者使用 Luminoth 内置的谷歌云平台支持在云端训练模型。
训练完成之后,你可以使用 Tensorboard 集成可视化进展和中间结果,还可使用不同的数据分割对模型进行评估。

可视化结果的能力一直很重要,尤其在计算机视觉领域。在模型训练完之后,使用我们的 UI 或者命令行接口,即可获得容易理解的摘要(summary)和结果的图可视化。

接下来,我们看一下 Luminoth 的安装过程及使用的注意事项。
Luminoth 现在支持 Python 2.7 和 3.4–3.6。
如已安装 TensorFlow 和 Sonnet,Luminoth 将使用已安装的版本。
只需运行:
$ pip install luminoth如果你的电脑上没有 TensorFlow 和 Sonnet 的 CPU 版本,则运行以上命令安装这些版本。
1. 安装 GPU 支持的 TensorFlow(https://www.tensorflow.org/install/)。
2. 安装 GPU 支持的 Sonnet(https://github.com/deepmind/sonnet#installation):
$ pip install dm-sonnet-gpu3. 从 PyPI 中安装 Luminoth:
$ pip install luminoth首先,将 repo 复制到你的电脑上,然后使用 pip 进行安装:
$ git clone https://github.com/tryolabs/luminoth.git
$ cd luminoth
$ pip install -e .只需运行 lumi --help。
目前,我们支持以下模型:
Faster R-CNN
我们计划近期增加对更多模型的支持,如 SSD、YOLO 和 Mask R-CNN。此外,我们还致力于在 Pascal VOC2012 等流行数据集上提供预训练的检查点。
运行 lumi 命令时,有一个主要的命令行接口可供使用。如果你对如何操作感到疑惑,只需键入:lumi --help 或 lumi <subcommand> --help,将会出现多个可用选项以及具体描述。
详见https://github.com/tryolabs/luminoth/blob/master/docs/DATASETS.md。
关于如何在本地训练或在谷歌云中训练,请查看https://github.com/tryolabs/luminoth/blob/master/docs/TRAINING.md。
我们试图获取有用、易于理解的摘要和图可视化。我们认为这不仅对于监督是必要的,对于增加对内部运行机制的理解同样大有裨益。这也使代码易于理解、容易学习,计算图也是如此。
摘要和图日志(graph log)的默认存储位置是/tmp/luminoth。你可以运行以下命令来使用 TensorBoard:
tensorboard --logdir /tmp/luminoth黑暗视镜是游戏《银河战士 Prime 2 黑暗回音(Metroid Prime 2: Echoes)》中的一款装备。它由 Luminoth 设计而成,可在与 Ing 的战斗中穿透黑暗 Aether 的烟雾。
Copyright © 2017, Tryolabs. Released under the BSD Clause-3.
原文来自:机器之心
声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com
Nano Banana(gemini-2.5-flash-image 和 gemini-3-pro-image-preview图像模型)是图像生成与编辑的最佳选择,可集成 Nano Banana API,实现高速预览。
支持通过自然语言文本智能生成高质量短视频。用户只需输入一段描述性文字,即可自动合成画面连贯、风格鲜明、配乐匹配的定制化视频内容。适用于短视频创作、广告预演、社交内容生成、游戏素材制作等场景,为开发者与创作者提供高效、灵活、富有想象力的视频生产新范式。
先进的图像理解和分析能力,它能够快速准确地解析和理解图像内容。无论是自然风景、城市建筑还是复杂的场景与活动,都能提供详细的描述和深入的分析。
根据文本提示(prompt)和图片公网访问链接,编辑原图按照特定风格、场景和氛围感的输出新的图像。广泛应用于电商营销、广告设计、创意灵感等领域,为用户带来高效且个性化的AI图像创作体验。
根据文本提示(prompt),生成生成具有特定风格、场景和氛围感的图像。广泛应用于电商营销、广告设计、创意灵感等领域,为用户带来高效且个性化的AI图像创作体验。