{"id":906,"date":"2025-07-06T05:28:51","date_gmt":"2025-07-06T05:28:51","guid":{"rendered":"https:\/\/janusai.pro\/?p=906"},"modified":"2025-07-06T05:28:52","modified_gmt":"2025-07-06T05:28:52","slug":"janus-4o-sharegpt-4o-image","status":"publish","type":"post","link":"https:\/\/janusai.pro\/fi\/janus-4o-sharegpt-4o-image\/","title":{"rendered":"Multimodaalisen kuvanmuodostuksen uusi t\u00e4hti: Janus-4o? JaaGPT-4o-Image asettaa uuden standardin tietojoukoille yhdenmukaistamalla kuvienmuodostuksen GPT-4o:n kanssa."},"content":{"rendered":"<div style=\"margin-top: 0px; margin-bottom: 0px;\" class=\"sharethis-inline-share-buttons\" ><\/div>\n<p><a href=\"https:\/\/sharegpt4o.github.io\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">JaaGPT-4o-kuva<\/a> on laajamittainen ja korkealaatuinen kuvanluontidatajoukko, jossa kaikki kuvat luodaan GPT-4o:n kuvanluontiominaisuuksilla.<\/p>\n\n\n\n<p>T\u00e4m\u00e4 aineisto pyrkii yhdist\u00e4m\u00e4\u00e4n avoimen l\u00e4hdekoodin multimodaalisten mallien edut GPT-4o:n vahvuuksiin visuaalisen sis\u00e4ll\u00f6n luomisessa. <\/p>\n\n\n\n<p>Se sis\u00e4lt\u00e4\u00e4 45 000 tekstist\u00e4 kuvaksi- ja 46 000 kuvasta tekstiksi -n\u00e4ytett\u00e4, mik\u00e4 tekee siit\u00e4 k\u00e4yt\u00e4nn\u00f6llisen resurssin multimodaalisten mallien parantamiseen kuvan luonti- ja muokkausteht\u00e4viss\u00e4.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"998\" height=\"700\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/f48c8349-9310-48a1-9276-d7614aa958d9.png\" alt=\"\" class=\"wp-image-911\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/f48c8349-9310-48a1-9276-d7614aa958d9.png 998w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/f48c8349-9310-48a1-9276-d7614aa958d9-300x210.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/f48c8349-9310-48a1-9276-d7614aa958d9-768x539.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/f48c8349-9310-48a1-9276-d7614aa958d9-18x12.png 18w\" sizes=\"auto, (max-width: 998px) 100vw, 998px\" \/><\/figure>\n\n\n\n<p>Janus-4o on multimodaalinen oikeustieteen maisteri (LLM), joka pystyy luomaan tekstist\u00e4 kuvaksi ja tekstist\u00e4 + kuvasta kuvaksi -yhdistelmi\u00e4. Se perustuu Janus-Pro:hen ja sit\u00e4 on hienos\u00e4\u00e4detty ShareGPT-4o-Image-aineiston avulla. Janus-Pro:hen verrattuna Janus-4o tuo mukanaan tekstist\u00e4 + kuvasta kuvaksi -yhdistelmi\u00e4 ja saavuttaa merkitt\u00e4vi\u00e4 parannuksia tekstist\u00e4 kuvaksi -yhdistelmien luonnissa.<\/p>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Sis\u00e4llysluettelo<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Sis\u00e4llysluettelon vaihtaminen\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/janusai.pro\/fi\/janus-4o-sharegpt-4o-image\/#Dataset_Overview\" >Tietojoukon yleiskatsaus<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/janusai.pro\/fi\/janus-4o-sharegpt-4o-image\/#Related_Links\" >Aiheeseen liittyvi\u00e4 linkkej\u00e4<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/janusai.pro\/fi\/janus-4o-sharegpt-4o-image\/#Paper_Introduction\" >Artikkelin esittely<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/janusai.pro\/fi\/janus-4o-sharegpt-4o-image\/#Method_Overview\" >Menetelm\u00e4n yleiskatsaus<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/janusai.pro\/fi\/janus-4o-sharegpt-4o-image\/#Experimental_Results\" >Kokeelliset tulokset<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/janusai.pro\/fi\/janus-4o-sharegpt-4o-image\/#Conclusions\" >Johtop\u00e4\u00e4t\u00f6kset<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Dataset_Overview\"><\/span>Tietojoukon yleiskatsaus<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>ShareGPT-4o-Image-aineisto sis\u00e4lt\u00e4\u00e4 91 000 GPT-4o-kuvan luontin\u00e4ytett\u00e4, jotka on luokiteltu seuraavasti:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Tekstist\u00e4 kuvaksi: 45 717<\/li>\n\n\n\n<li>Teksti-plus-kuva-kuvaksi: 46 539<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Related_Links\"><\/span>Aiheeseen liittyvi\u00e4 linkkej\u00e4<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Koodi: <a href=\"https:\/\/github.com\/FreedomIntelligence\/ShareGPT-4o-Image\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">github klikkaa t\u00e4st\u00e4<\/a><\/p>\n\n\n\n<p>Malli: <a href=\"https:\/\/huggingface.co\/FreedomIntelligence\/Janus-4o-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">hanki ShareGPT-4o-Image-malli<\/a><\/p>\n\n\n\n<p>Paperi: <a href=\"https:\/\/arxiv.org\/pdf\/2506.18095\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">klikkaa t\u00e4st\u00e4<\/a><\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Paper_Introduction\"><\/span>Artikkelin esittely<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Viimeaikaiset edistysaskeleet multimodaalisissa generointimalleissa ovat mahdollistaneet realistisen, k\u00e4skyjen mukaisen kuvan generoinnin. Johtavat j\u00e4rjestelm\u00e4t, kuten GPT-4o-Image, ovat kuitenkin edelleen suljettuja ja saavuttamattomissa.<\/p>\n\n\n\n<p>Jotta n\u00e4m\u00e4 ominaisuudet olisivat yleis\u00f6n saatavilla, artikkelissa esitell\u00e4\u00e4n ShareGPT-4o-Image, ensimm\u00e4inen aineisto, joka sis\u00e4lt\u00e4\u00e4 45 000 tekstist\u00e4 kuvaksi- ja 46 000 tekstist\u00e4 ja kuvasta kuvaksi -esimerkki\u00e4. Kaikki n\u00e4m\u00e4 esimerkit on syntetisoitu GPT-4o:n kuvanluontiominaisuuksia k\u00e4ytt\u00e4en sen edistyneiden kuvanluontiominaisuuksien parantamiseksi. T\u00e4m\u00e4n aineiston avulla artikkelissa kehitettiin Janus-4o, multimodaalinen laaja kielimalli, joka pystyy luomaan tekstist\u00e4 kuvaksi ja tekstist\u00e4 ja kuvasta kuvaksi -muunnoksia.<\/p>\n\n\n\n<p>Janus-4o ei ainoastaan paranna merkitt\u00e4v\u00e4sti tekstist\u00e4 kuvaksi -generointiominaisuuksia edelt\u00e4j\u00e4\u00e4ns\u00e4 Janus-Pro:hen verrattuna, vaan se esittelee my\u00f6s tekstist\u00e4 ja kuvasta kuvaksi -generointiominaisuudet. Merkillepantavaa on, ett\u00e4 se saavuttaa vaikuttavan suorituskyvyn kuvien luomisessa tekstist\u00e4 ja kuvista tyhj\u00e4st\u00e4 k\u00e4ytt\u00e4m\u00e4ll\u00e4 vain 91 000 synteettist\u00e4 n\u00e4ytett\u00e4 ja sit\u00e4 on koulutettu 6 tuntia 8\u00d7A800 GPU -koneella.<\/p>\n\n\n\n<p>Toivomme, ett\u00e4 ShareGPT-4o-Imagen ja Janus-4o:n julkaisu edist\u00e4\u00e4 avointa tutkimusta fotorealistisessa, k\u00e4skyjen mukaisessa kuvanmuodostuksessa.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Method_Overview\"><\/span>Menetelm\u00e4n yleiskatsaus<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1028\" height=\"718\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/74bd55e5-5cc6-49e8-be21-cf5c4a66042d.png\" alt=\"\" class=\"wp-image-908\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/74bd55e5-5cc6-49e8-be21-cf5c4a66042d.png 1028w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/74bd55e5-5cc6-49e8-be21-cf5c4a66042d-300x210.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/74bd55e5-5cc6-49e8-be21-cf5c4a66042d-1024x715.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/74bd55e5-5cc6-49e8-be21-cf5c4a66042d-768x536.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/74bd55e5-5cc6-49e8-be21-cf5c4a66042d-18x12.png 18w\" sizes=\"auto, (max-width: 1028px) 100vw, 1028px\" \/><\/figure>\n\n\n\n<p><strong>ShareGPT-4o-Image parantaa kuvien luonnin suorituskyky\u00e4.<\/strong> Hienos\u00e4\u00e4t\u00e4m\u00e4ll\u00e4 Janus-Pro:t\u00e4 ShareGPT-4o-Image-ty\u00f6kalulla loimme Janus-4o:n, joka osoittaa merkitt\u00e4v\u00e4sti parantunutta kuvanluontitehoa. Janus-4o tukee my\u00f6s tekstist\u00e4 kuvaksi- ja kuvasta kuvaksi -muunnoksia, ja se suoriutui muita vertailuarvoja paremmin vain 91 000 harjoitusn\u00e4ytteell\u00e4.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"370\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/fc3b163f-d1d2-42f5-81bc-884eb677ea52.png\" alt=\"\" class=\"wp-image-910\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/fc3b163f-d1d2-42f5-81bc-884eb677ea52.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/fc3b163f-d1d2-42f5-81bc-884eb677ea52-300x108.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/fc3b163f-d1d2-42f5-81bc-884eb677ea52-768x278.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/fc3b163f-d1d2-42f5-81bc-884eb677ea52-18x7.png 18w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p><strong>Janus-4o-mallin yleiskatsaus.<\/strong> Malli perustuu Janus-Pro:hen ja se on rakennettu hienos\u00e4\u00e4t\u00e4m\u00e4ll\u00e4 sit\u00e4 ShareGPT-4o-Image-alustalla. Se sis\u00e4lt\u00e4\u00e4 parannuksia tekstist\u00e4 kuvaksi- ja kuvasta kuvaksi -luontitoimintojen tukemiseksi. Sek\u00e4 tekstist\u00e4 kuvaksi- ett\u00e4 tekstist\u00e4 kuvaksi -teht\u00e4v\u00e4t koulutetaan yhdess\u00e4.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1058\" height=\"304\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/2b81408d-3c8b-45a8-ac73-ee0a48164c05.png\" alt=\"\" class=\"wp-image-909\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/2b81408d-3c8b-45a8-ac73-ee0a48164c05.png 1058w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/2b81408d-3c8b-45a8-ac73-ee0a48164c05-300x86.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/2b81408d-3c8b-45a8-ac73-ee0a48164c05-1024x294.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/2b81408d-3c8b-45a8-ac73-ee0a48164c05-768x221.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/2b81408d-3c8b-45a8-ac73-ee0a48164c05-18x5.png 18w\" sizes=\"auto, (max-width: 1058px) 100vw, 1058px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Experimental_Results\"><\/span>Kokeelliset tulokset<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1072\" height=\"1140\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/72720ada-7418-4979-a8fd-4ce09050d696.png\" alt=\"\" class=\"wp-image-907\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/72720ada-7418-4979-a8fd-4ce09050d696.png 1072w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/72720ada-7418-4979-a8fd-4ce09050d696-282x300.png 282w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/72720ada-7418-4979-a8fd-4ce09050d696-963x1024.png 963w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/72720ada-7418-4979-a8fd-4ce09050d696-768x817.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/07\/72720ada-7418-4979-a8fd-4ce09050d696-11x12.png 11w\" sizes=\"auto, (max-width: 1072px) 100vw, 1072px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Conclusions\"><\/span>Johtop\u00e4\u00e4t\u00f6kset<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>ShareGPT-4o-Image on ensimm\u00e4inen laajamittainen aineisto, joka pystyy hy\u00f6dynt\u00e4m\u00e4\u00e4n GPT-4o:n edistyneit\u00e4 kuvanluontiominaisuuksia tekstist\u00e4 kuvaksi ja tekstist\u00e4 kuvaksi -muodossa. T\u00e4m\u00e4n aineiston pohjalta artikkelissa kehitettiin Janus-4o, koneoppimismalli (MLLM), joka pystyy luomaan korkealaatuisia kuvia pelk\u00e4st\u00e4 tekstist\u00e4 tai kuva-teksti-yhdistelmist\u00e4.<\/p>\n\n\n\n<p>Janus-4o saavuttaa merkitt\u00e4vi\u00e4 parannuksia tekstist\u00e4 kuvaksi -generoinnissa ja eritt\u00e4in kilpailukykyisi\u00e4 tuloksia tekstist\u00e4 kuvaksi -teht\u00e4viss\u00e4, mik\u00e4 osoittaa ShareGPT-4o-Imagen korkean laadun ja k\u00e4yt\u00e4nn\u00f6llisyyden.<\/p>\n\n\n\n<p>MLLM-pohjaisen itseregressiivisen kuvanmuodostuksen tehokkuuden ansiosta Janus-4o voidaan kouluttaa vain kuudessa tunnissa 8\u00d7A800 GPU -koneella ja saavuttaa merkitt\u00e4vi\u00e4 suorituskyvyn parannuksia eritt\u00e4in alhaisilla laskentavaatimuksilla.<\/p>","protected":false},"excerpt":{"rendered":"<p>ShareGPT-4o-Image on laajamittainen ja korkealaatuinen kuvienluontiaineisto, jossa kaikki kuvat luodaan GPT-4o:n kuvanluontiominaisuuksilla. T\u00e4m\u00e4n aineiston tavoitteena on yhdist\u00e4\u00e4 avoimen l\u00e4hdekoodin multimodaalisten mallien edut GPT-4o:n vahvuuksiin visuaalisen sis\u00e4ll\u00f6n luomisessa. Se sis\u00e4lt\u00e4\u00e4 45 000 tekstist\u00e4 kuvaksi- ja 46 000 kuvasta tekstiksi -n\u00e4ytett\u00e4, mik\u00e4 tekee siit\u00e4 k\u00e4yt\u00e4nn\u00f6llisen resurssin multimodaalisten mallien parantamiseen kuva\u2026<\/p>","protected":false},"author":2,"featured_media":859,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-906","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/posts\/906","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/comments?post=906"}],"version-history":[{"count":1,"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/posts\/906\/revisions"}],"predecessor-version":[{"id":912,"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/posts\/906\/revisions\/912"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/media\/859"}],"wp:attachment":[{"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/media?parent=906"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/categories?post=906"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/janusai.pro\/fi\/wp-json\/wp\/v2\/tags?post=906"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}