Midjourney训练AI使用的艺术家数据库名单泄露引发争议报道,用于训练Midjourney的生成式人工智能(AI)程序的艺术家数据库已泄露,引起社交媒体和艺术界的广泛争议。泄露的名单中包括一些知名艺术家,如Banksy、David Hockney等。
据悉,这份名单被称为“Midjourney风格列表”,其中包含超过16,000名艺术家的名字。除了著名的现代艺术家外,名单还包括2021年为医院创作绘画的六岁儿童等各个领域的艺术家。该列表详细指定了这些艺术家的时间段、艺术运动、媒介、流派以及与视频游戏软件相关的信息。
尽管这份电子表格目前似乎已无法访问,但在互联网档案馆和2023年11月提交的法庭文件中仍然可以查看。这些文件是一个集体诉讼的一部分,由10名视觉艺术家于去年1月提起,指控DeviantArt、Midjourney、Stability AI和Runway AI侵犯版权,未经授权使用他们的作品来训练人工智能。
有关法庭文件的详细信息显示,Midjourney首席执行官David Holz在2022年2月首次发布了这份列表,他在Discord服务器上的消息中解释了如何使用这些艺术家的名字作为生成图像的文本提示。他明确表示这不仅仅是流派,还涉及艺术家的名字,总计达到4000多位,并覆盖了1000多种艺术风格。
在一些社交媒体截图中,Riot Games艺术家Jon Lam显示了Holz和其他Midjourney开发人员讨论数据库中至少包含4700位独立艺术家作品的消息。据透露,这些艺术家的名字是从Wikipedia和在线交易卡游戏Magic the Gathering中收集而来。此外,软件开发者Brad Templeton的消息警告Holz可能会在使用真实艺术家作品进行训练时面临“版权问题”。
截至目前,Midjourney尚未回复Hyperallergic的评论请求,而这一事件也进一步引发了对未受监管的生成式人工智能发展的担忧,包括未来就业和版权侵犯的指控,促使了更多的诉讼和国会听证会。
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
阿里云通义千问APP近日上线了一项名为“通义舞王”的免费功能,用户只需在APP内输入相应口令并上传照片,系统即可生成个性化的舞蹈视频。Meta发布生成式AI调试工具HawkEyeMeta发布了一款名为HawkEye的生成式AI调试工具,旨在解决机器学习模型在生产中面临的挑战。它能够帮助模型更好地理解和分析图像内容。
AI视频一跃成为“明日之星”,大厂和创业公司们打得热火朝天。去年12月,Pika的出现仿佛点燃了AI视频赛道的引线,一个月之内冒出了近十家公司,谷歌、阿里、字节、腾讯竞相下场,不断将战事推向了。一旦成为了生产力,整个产业链条的消费端将开始出现购买力,消费端的需求推着供给端进化,至此,AI视频才算彻底“活了”。
Midjourney昨晚发布了一些重要的消息,称他们即将开始训练视频模型,并且计划从一月开始进行这项工作。他们还宣布下周将迎来V6版本的一次重要更新,其中文本处理方面将有显著的进步,内容的连贯性会有所提高,并且对于提示的准确性也将得到改善。这些重要的信息表明了Midjourney在视频生成领域将成为一个有力的竞争者。
被许多人认为是范围最广、准确性最高且输出惊人写实效果的AI图像生成器之一的Midjourney,现在解决了其主要缺点。Midjourney网站截图Midjourney原本运行于Discord社交媒体平台,这带来了一些用户界面和整体用户体验上的特殊性,使注册过程和模型的实际使用变得复杂,这可能会让一些人对使用该工具望却步。其他AI图像生成器,如GoogleImagen2和DALL-E3,已在输出的真实感、对更长提示的解释可靠性以及图像中文本的处理方面赶上Midjourney,但预计Midjourney将在即将发布的v6版本中再次向前迈进,预计将在圣诞节前发布。
文本到图像生成器Midjourney于12月21日开始对其最新版本6模型进行alpha测试。用户很快声称,这次更新似乎扩大了生成器的功能,但包含的结果似乎与已知的受版权保护的艺术过于相似。Midjourney尚未对用户的指控作出回应。
Midjourney昨晚发布了重要消息,将开始视频模型训练,同时计划下周推出V6版本的重大更新。该更新将在文本处理方面有显著进步,提高内容连贯性和提示准确性。项目地址:字节推图像分割项目UniRefUniRef项目由字节公司推出,通过整合即参考图像分割、少镜头图像分割、参考视频对象分割和视频对象分割四种方式,利用UniFusion模块和SAM模型提高图像分
Midjourney在沉寂九个月后推出了MidjourneyV6,这个文生图产品体现出的更细腻的细节处理,更强大的语言理解能力和更加“不像AI”的图片效果在过去几天引发一片惊呼。作为一个闭源的模型产品,Midjourney的魔法配方并不为人所知,但就像OpenAI和Google一样它会在产品更新时发布官方技术公告,有心人还是可以从中一窥模型能力提升的技术原理。
Midjourney在discord社区宣布开放V6模型的alpha版本测试。从“/settings”的下拉菜单中选择v6,或在提示符后输入“--v6”,就可以测试最新的V6模型了。V6可能不那么生动,但如果提示词是明确的,V6现在可以更好地理解你;4.较低的-stylize值可能会更好地理解提示词较高的值可能有更好的视觉效果。
经过长达半年的等待,MidjourneyV6模型终于要来了。MidjourneyV6模型将在下周发布今天Midjourney正式开始了社区风格评价。尽管这些图片是随机生成的,但也可以从中看出V6模型的质量。
Midjourney公司在周二宣布,他们计划在未来几个月推出“文本转视频”模型。据CEODavidHolz在“OfficeHour”Discord会议中表示,公司将于1月开始培训视频模型。通过AI生成、操控和与视频内容互动的能力为我们打开了许多可能性,从使娱乐者和广告商更轻松地进行创作,到潜在地重塑我们对现实的感知。
Speech To Text - AI是一个在线工具,能够将用户上传的音频文件或者YouTube视频链接转换为文本。这款应用使用先进的AI技术来识别和转录音频内容,使得用户能够快速方便地从音频中获得文本信息。
Coloromo是一个艺术生成器,可以将您的照片转化成各种艺术风格的作品,无需设计技能。用户只需上传照片,然后选择喜欢的艺术风格,便可免费下载或购买打印作品。Coloromo能够为个人用户创造个性化艺术作品,也能为商业用户提供高分辨率广告素材,增强数字内容的质感。同时,Coloromo也可以合作艺术家将其作品转化成更多艺术品种类。
多墨智能写作是一款由人工智能强力驱动的创意写作工具,帮助职场人提高工作交付效率。它独家支持根据不同岗位通过算法一键生成工作文档,适合各种职业需求,包括产品经理、抖音运营专员、战略咨询专家、老师、医生、公职人员、旅游导游、公关等。多墨智能写作提供一键成文、辅助撰写、命令自定义和私有化部署等功能,可定制解决方案并保护内部数据隐私。
Vista-LLaMA是一种先进的视频语言模型,旨在改善视频理解。它通过保持视觉令牌与语言令牌之间的一致距离,无论生成文本的长度如何,都能减少与视频内容无关的文本产生。这种方法在计算视觉与文本令牌之间的注意力权重时省略了相对位置编码,使视觉令牌在文本生成过程中的影响更为显著。Vista-LLaMA还引入了一个顺序视觉投影器,能够将当前视频帧投影到语言空间的令牌中,捕捉视频内的时间关系,同时减少了对视觉令牌的需求。在多个开放式视频问答基准测试中,该模型的表现显著优于其他方法。
GenSAM是一种针对迷彩对象检测(COD)的方法,它使用Cross-modal Chains of Thought Prompting (CCTP)技术来理解视觉提示,并利用通用文本提示来获取可靠的视觉提示。该方法通过渐进式掩膜生成(PMG)在测试时自动生成并优化视觉提示,无需额外训练,实现高效准确的迷彩目标分割。
Chronicle是一个全新的故事创作工具,通过精心设计的模块化Blocks,让用户可以轻松地创建具有完美设计、互动性和动态效果的故事。用户可以定制Blocks、嵌入链接、以键盘为主的工作流程,并与团队实时协作,还可以通过专家认证的模板快速启动创作。
FutureFinder是一款AI驱动的个人教育顾问,能为您提供学校/大学和职业选择方面的智能、个性化建议。通过易于理解的推荐和有用的资源,帮助您找到最适合自己的道路。使用GPT-4技术,它能进行全面评估并提供定制结果,还能评估您的大学申请,提供智能建议并进行模拟面试。不仅如此,它还提供个性化的学府和职业道路建议,并在申请过程中提供详细的支持。适用于高中生、大学生和职场人士,帮助他们在教育和职业方面做出明智的决定。
Invoice Reader Application是一个移动APP扫描应用。它使用光学字符识别技术,可以自动识别和提取上的关键信息,比如号码、日期、供应商和金额等,大大简化了账务处理工作。该应用支持识别多种语言的,覆盖全球主要市场。它可以将识别结果直接导入excel等软件,也可以连接到会计系统,实现自动记账。该应用使用简洁的界面,操作非常方便,可以快速提高企业和个人的处理效率。
MathPile是一个包含约95亿个标记的数学中心语料库,从教科书(包括讲座笔记)、arXiv、维基百科、ProofWiki、StackExchange和网页中汲取数学内容,适用于K-12、大学、研究生水平和数学竞赛。MathPile的数据质量高,并且有着丰富的数据文档,以增强透明度和给用户灵活的使用数据的能力。在授权方面,MathPile遵循BY-NC-SA 4.0许可协议,同时计划很快发布一个商业可用版本。
Rationale是一种性的AI,可以帮助企业主、经理和个人做出艰难的决定。通过考虑所有相关因素和背景,Rationale可帮助您做出理性的决定。它具有人工智能决策工具的四种技术,包括决策分析技术、上下文分析、可定制的音调和多种语言支持。Rationale提供三种定价选择,分别是Lite、Standard和Max,价格在$9.99到$99.99不等。
Zeta是一个开源项目,提供模块化、高性能和可扩展的构建块来快速构建AI模型。它包括多种功能,如Flash Attention、SwiGLU、相对位置偏差、前馈网络、BitLinear变换、PalmE多模态模型、U-Net、视觉嵌入和其他多种高级特性。
DeepFashion 是一个 AI 时尚创新平台,通过训练品牌 AI 模型,为用户生成与其个性风格相符的时尚造型。用户只需上传 5 张图片并进行 10 分钟的训练,AI 助手每天就能生成 17280 张高分辨率 4K 时尚 LOOK 图像,完美体现用户的个性特点。这个创新且高效的工具将提升您的时尚体验。
米啫喱是一款能够通过AI智能技术进行绘画创作的工具。它可以快速生成各种图画,提供多种样式和艺术性选择。用户可以上传参考图作为创作参考,还可以根据个人喜好调整细节丰富度和文本偏离值等参数。开通会员后,用户将享受无限制的创作权限。米啫喱是设计师、艺术家和创作者的理想选择。
自动检测平台是一个省心、专业的论文生成工具。它提供了自动生成论文范文的功能,用户只需要输入论文标题即可得到范文,同时还包括论文的自动检测和查重报告。用户可以选择不同的学历和模型,生成符合要求的论文。自动检测平台能够帮助用户节省写论文的时间,提供高质量的范文,方便用户进行学术研究和写作。
ASKWay利用ChatGPT和GPT-4,提供创新的AI聊天和助手体验。用户可以创建独特的AI聊天机器人伙伴,定制外观,培养个性,分享情感,减轻焦虑,与之共同成长。该应用提供沉浸式AI体验和AI时间创意工作坊,鼓励用户进行艺术表达、技术实践和跨学科合作。
笔杆论文写作是一款专业的写论文平台,提供内容生成、素材推荐、修改润色、论文查重、审核校对、智能降重、多语言翻译等全流程写论文工具。它通过数十亿学术文献为 AI 赋能,实现自主创作,快速高效,保证原创度。同时,提供沉浸式论文写作、写作模板、智能提纲推荐、写作思路推荐、论文查重等丰富的论文服务,满足写论文当中的所有需求。
歌者PPT是一款能够帮助用户生成高质量PPT的工具。用户只需输入标题,AI就可以根据用户的需求帮助完成PPT的创作PP电子app下载,节约用户构思和美化时间。歌者PPT提供多种模式轻松输入,能够适应不同的使用场景,同时也提供丰富的模板和工具供用户自由编辑。用户还可以一键分享或下载PPT文件。歌者PPT定位于节省用户时间,提供高质量的PPT创作服务。
茅茅虫是一站式论文在线写作平台,提供论文写作助手、论文开题、论文答辩、论文查重等功能。通过人工智能技术,帮助用户提升写作能力,提供论文灵感、生成论文提纲、降重、查重等服务。
Otto SEO是一个利用人工智能技术进行SEO优化的在线平台。它结合了数十年的SEO专业知识以及最先进的AI模型,简化了SEO内容生成、技术优化等复杂流程。用户可以为不同的品牌定制语音,生成针对品牌个性化的独特优化内容。平台内容通过检测 Basically Human 得到99%以上符合人类原创的结果。支持无限量WordPress集成、Zapier等第三方工具连接,以及内容排期发布等功能。Otto SEO的目标是完全取代传统数字营销代理机构,以更高效、低成本的方式满足用户的SEO需求。