Sinusuri ng bagong ulat ang estado ng enterprise AIarial; maintindihan

Ang ulat, na tinatawag na "Ang Estado ng AI Infrastructure sa Scale 2024: Pagpapakita ng mga sitwasyon sa hinaharap, mahahalagang insight at mga benchmark ng negosyo“, sinusuri kung paano itinatayo ng mga kumpanya na may iba't ibang laki sa North America, Europe at Asia-Pacific ang kanilang imprastraktura artificial intelligence (AI), ang mga hamon na kinakaharap nila at kung paano nila inuuna ang mga solusyon sa AI ayon sa kanilang mga kaso ng paggamit.

ADVERTISING

Ang pangunahing driver para sa paglago ng merkado ng imprastraktura ng AI ay ang pagsasakatuparan ng mga kumpanya na maaaring mapalakas ng AI ang kanilang kahusayan sa pagpapatakbo at produktibo ng workforce. Parami nang parami, ang mga kumpanya ay naghahanap ng mga solusyon sa AI upang kunin ang mahahalagang insight mula sa kanilang mga panloob na database at planong mag-deploy ng generative AI upang mapataas ang kanilang competitive advantage, mapabuti ang productivity ng manggagawang may kaalaman at maapektuhan ang kanilang bottom line.

Sinuri ng pananaliksik hindi lamang ang pagsasanay sa modelo, kundi pati na rin ang paggamit at paghihinuha ng mga modelong ito upang maunawaan ang pinakamalaking paghihirap na kinakaharap ng mga kumpanya kapag inilipat ang AI/ML sa produksyon.

"Ipinapakita ng aming pananaliksik na habang ang karamihan sa mga organisasyon ay nagpaplano na palawakin ang kanilang imprastraktura ng AI, hindi nila kayang i-deploy ang Generative AI nang hindi binibigyang-priyoridad ang mga tamang kaso ng paggamit," sabi ni Noam Harel, punong marketing officer at general manager ng ClearML para sa North America. “Ina-explore din namin ang maraming hamon na kinakaharap ng mga organisasyon sa kanilang kasalukuyang mga workload ng AI at kung paano ang kanilang mga ambisyosong plano para sa hinaharap ay nagpapahiwatig ng pangangailangan para sa mataas na pagganap at cost-effective na mga paraan upang ma-optimize ang paggamit ng GPU (o maghanap ng mga alternatibo sa mga GPU) at gamitin ang end-to- tapusin, pinagsama-samang AI/ML platform upang humimok ng mahusay, self-service computing orkestrasyon at pag-iskedyul na may pinakamataas na paggamit."

ADVERTISING

"Maraming claim tungkol sa kung paano tinutugunan ng mga kumpanya ang kanilang mga pangangailangan para sa mabilis na pag-unlad ng mga kakayahan sa imprastraktura ng AI at pagsasama ng Generative AI sa kanilang mga produkto. Ang ulat na ito ay nagbibigay ng mahirap na data upang masagot ang mga tanong na ito, "sabi ni June Paik, CEO ng FuriosaAI. "Sa partikular, ipinapakita nito kung paano aktibong naghahanap ang mga kumpanya ng mga bagong opsyon na cost-effective para sa inference computing. Nasasabik kaming makita na ang aming pangalawang henerasyong produkto, na ilulunsad sa huling bahagi ng taong ito, ay direktang tumutugon sa isa sa mga pangunahing alalahanin na binanggit sa ulat.

Ang ulat ay nagpapakita ng radikal na pagbabago sa pag-aampon ng AI ng mga kumpanya; alam pa

Isang bagong ulat mula sa a16z ang nakapanayam ng Fortune 500 na kumpanya at nangungunang mga pinuno ng negosyoariaay tungkol sa pag-aampon ng artificial intelligence (AI), na natuklasan na ang parehong mga saloobin at pamumuhunan ay nagbago nang malaki sa nakalipas na anim na buwan.

Mga pangunahing insight mula sa ulat

96% ng mga respondent ang nagpaplanong palawakin ang kanilang AI computing infrastructure, na naghahanap ng flexibility at bilis. Ang pangunahing problema para sa cloud computing ay waste/idle na mga gastos.

Itinuturing ng 95% ng mga executive na mahalagang magkaroon at gumamit ng teknolohiyang Open Source. Sa mga nakapanayam, 96% ay nakatuon sa pag-customize ng mga modelo ng Open Source. Ang PyTorch ay ang balangkas ng pagpili.

74% ng mga kumpanya ay hindi nasisiyahan sa kanilang kasalukuyang pag-iiskedyul ng gawain at mga tool sa orkestrasyon at nahaharap sa mga limitasyon sa paglalaan ng on-demand na mapagkukunan ng computing at produktibidad ng mga kawani. Sa mga respondent na ito, 74% ang nakikita ang halaga sa pagkakaroon ng mga kakayahan sa pag-compute at pag-iskedyul bilang bahagi ng iisang platform ng AI/ML (sa halip na mag-assemble ng suite ng mga standalone point solution). 19% lang ng mga respondent ang may tool sa pag-iiskedyul na nagbibigay-daan sa kanila na tingnan at pamahalaan ang mga gawain sa loob ng mga pila at epektibong i-optimize ang paggamit ng GPU. Mahalagang tandaan na 93% ng mga executive na na-survey ay naniniwala na ang AI team productivity ay tataas.aria malaki-laki kung ang mga mapagkukunan sa pag-compute ay maaaring self-service.

Ang pag-optimize ng GPU utilization at GPU partitioning ay mga pangunahing alalahanin, na karamihan sa mga GPU ay hindi gaanong ginagamit sa mga peak period. 40% ng mga respondent, anuman ang laki ng kumpanya, ay nagpaplanong gumamit ng teknolohiya ng orkestra at pag-iskedyul para ma-maximize ang mga kasalukuyang compute investment mula sa kanilang kasalukuyang imprastraktura ng AI. 42% lang ng mga negosyo ang may kakayahang pamahalaan ang mga kakayahan ng dynamic na partitioning ng MiG/GPU para ma-optimize ang paggamit ng GPU.

Ang gastos ay ang pangunahing kadahilanan sa pagbili para sa inference computing. Upang matugunan ang kakulangan ng GPU, 52% ng mga respondent ang nag-ulat na aktibong naghahanap sila ng mga alternatibong cost-effective sa mga GPU para sa hinuha sa 2024, kumpara sa 27% para sa pagsasanay. Sa mga respondent na ito, 20% ay interesado sa mga alternatibong cost-effective sa mga GPU, ngunit walang alam sa mga kasalukuyang alternatibo.

Basahin din:

Ang pagtaas ng mga chatbot para sa kalusugan ng isip; maintindihan