计算机科学学位的技术往往要落后于现实。许多学校都要求花好几个月的时间制作课程大纲,如果里边的内容无法做到超前几年,那么也就意味着该学科的本科生和研究生都无法学习到前沿技术。不过近些年来,许多学校已经涉足并开始教授人工智能(AI)、机器学习等流行课题,甚至还包括了研究生。与此同时,一些科技公司也在推动教育教学进程上做出了贡献。
Cloudsight是一家提供计算机视觉API的公司,位于洛杉矶。日前,他们宣布推出了一款免费的API,面向教育机构开放。
Cloudsight在他们的API中建立一套属于自己的数据库,据了解,目前已经经过了4亿多张图片的训练后,可以对图片进行标签、识别和细节描述。也就是说,Cloudsight提供的图像识别 API,不仅能识别图片,还能理解图片的含义。例如:
能识别出一张人物图是绘画还是照片,当然性别也能识别出来;
能识别出与外观与常规很不同的图并准确描述(比如:给了一张涂了很多指甲油的手指图,它告诉我:黑白色圆点的指甲);
基本能识别出一段乱糟糟图片元素中的焦点,并且可以给没有直接名词的物体做准确描述(比如给了一张路边界碑的照片,背景很乱,它的识别是:灰色的水泥标牌);
一些景点和建筑能准确说出名称(给了张大裤衩的图,识别结果是:中国中央电视台总部)。
以下是网友给出的操作方法,可能更适用于个人/小B用户:
首先,到CloudSight网址注册账号,create 一个project,然后获取到API key。然后,将代码保存为py文件,在cmd当中进入保存py文件的文件夹,然后输入命令:python xxx.py “photo URL”即可输出识别图片(image Recognition)结果。
业内人士点评,如果自己研发做图像识别的成本比较高,尤其是在没有一个很好的硬件设施(GPU)的情况下,还是通过API比较合适。但API也有不足,现成的API实现的往往不完全是自己想要的功能,所以可能的话还是多了解自己训练模型。
原文来自:36Kr
声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com
提供多种拟人音色,支持多语言及方言,并可在同一音色下输出多语言内容。系统可自适应语气,流畅处理复杂文本。
Nano Banana(gemini-2.5-flash-image 和 gemini-3-pro-image-preview图像模型)是图像生成与编辑的最佳选择,可集成 Nano Banana API,实现高速预览。
支持通过自然语言文本智能生成高质量短视频。用户只需输入一段描述性文字,即可自动合成画面连贯、风格鲜明、配乐匹配的定制化视频内容。适用于短视频创作、广告预演、社交内容生成、游戏素材制作等场景,为开发者与创作者提供高效、灵活、富有想象力的视频生产新范式。
先进的图像理解和分析能力,它能够快速准确地解析和理解图像内容。无论是自然风景、城市建筑还是复杂的场景与活动,都能提供详细的描述和深入的分析。
根据文本提示(prompt)和图片公网访问链接,编辑原图按照特定风格、场景和氛围感的输出新的图像。广泛应用于电商营销、广告设计、创意灵感等领域,为用户带来高效且个性化的AI图像创作体验。