Selama setahun terakhir, narasi bisnisnya sederhana: berikan AI ke tangan karyawan Anda secepat mungkin. Perlombaan telah dimulai. Alat-alatnya ajaib. Masa depan adalah sekarang.
Namun baru-baru ini, perubahan besar terjadi di ruang rapat. Bulan madu resmi berakhir. Dan tagihannya telah tiba.
Menurut laporan terbaru, pengguna awal seperti Amazon, Walmart, Cisco, Uber, dan Meta secara aktif membatasi penggunaan AI internal. Bukan karena teknologinya gagal. Karena mereka melihat tagihan server mereka dan menyadari bahwa mereka secara tidak sengaja telah menciptakan monster finansial.
Saat kami membantu bisnis bernavigasitransformasi digital, penting untuk memahami mengapa hal ini terjadi dan bagaimana cara menghindarinyaperangkap token.
Bangkitnya Agen (dan Matinya Penagihan Tarif Tetap)
Untuk sementara, kami semua dilatih untuk menganggap AI itu murah. Atau bahkan gratis. Namun komputasi tidak pernah gratis.
Biaya awal disubsidi oleh model berlangganan tarif tetap. Anda membayar dua puluh dolar sebulan dan mendapat akses tak terbatas ke model perbatasan. Rasanya seperti sebuah tawar-menawar. Namun seiring dengan beralihnya laboratorium AI seperti OpenAI dan Anthropic ke berbasis penggunaanpenagihan per token, dampak sebenarnya dari kecerdasan buatan semakin terungkap.
Token, bagi yang belum tahu, adalah unit dasar data yang diproses oleh model AI. Setiap kata yang Anda kirim, setiap kata yang Anda terima, setiap langkah penalaran di antaranya—tanda-tanda. Dan jumlahnya bertambah dengan cepat.
Pergeseran penagihan ini bertepatan dengan evolusi teknologi: lompatan dari chatbots keAgen AI.
Chatbot menunggu perintah Anda, menjawab, dan tertidur. Agen AI bersifat otonom. Itu berputar. Itu beralasan. Ini menjalankan alur kerja yang kompleks dan memicu agen lain. Seperti yang disampaikan oleh Chief Product Officer Cisco, Jeetu Patel, penggelaran agen memerlukan infrastruktur yang jauh lebih banyak. Setiap karyawan manusia mungkin tiba-tiba memiliki sepuluh, seratus, atau bahkan seribu agen AI yang bekerja tanpa kenal lelah di belakang layar.
Pengurasan komputasi sangat mengejutkan.
Pemeriksaan Realitas Perusahaan: Membakar Anggaran 2026 pada bulan April
Ketika teknologi menjadi mainan dan bukan alat, anggaran pun menguap.
Ambilbekerja, sebuah perusahaan perangkat lunak yang melihat penyebaran penggunaan AI"seperti api"di antara 1.300 karyawannya. Ketika Anthropic beralih ke penagihan per token pada bulan Mei, biaya Workato melonjak7x pada hari pertama.Reaksi CIO mereka?"Sial, kita membuat monster."
ubermenghadapi krisis serupa. COO mereka mengakui bahwa menjadi tidak mungkin untuk membenarkan pembelanjaan token yang besar terhadap keluaran fitur konsumen yang sebenarnya. Situasi menjadi tidak terkendali sehingga Uber menghabiskan seluruh anggaran AI 2026 yang dialokasikan pada bulan April tahun ini. Mereka sekarang telah membatasi pengeluaran token individu karyawan sebesar $1,500 per bulan.
DiAmazon, para insinyur menjadi agen bangunan hanya untuk mencapai papan peringkat produktivitas internal. Manajemen harus turun tangan dan secara eksplisit memperingatkan tim untuk berhenti menggunakan“AI demi AI.”
Polanya jelas. Adopsi AI yang tidak terkendali, dikombinasikan dengan penagihan per token dan agen otonom, menciptakan ledakan biaya yang melampaui keuntungan terukur.
Peretasan Kehidupan:Tanggung Jawab Keuangan AIdan Perutean Model
Jadi apakah ini berarti revolusi AI sedang terhenti? Sama sekali tidak. Ini berarti industri ini sudah matang. Kita sedang memasuki eraTanggung Jawab Keuangan AI.
Jika Anda adalah pemimpin bisnis yang mengintegrasikan AI, inilah pedoman Anda untuk menghindari kebangkrutan departemen TI Anda.
1. Berhenti Menggunakan Ferrari untuk Pergi ke Toko Kelontong
Anda tidak memerlukan model frontier yang paling mahal—GPT-4o, Claude 3.5 Sonnet, atau apa pun yang terbaru minggu ini—untuk setiap tugas.
Peretasan: terapkan Model Routing.Menilai kesesuaian dan tujuan tugas. Jika seorang karyawan meringkas email dasar, arahkan kueri tersebut ke model yang lebih lama dan lebih murah. Simpan token premium untuk pengkodean yang rumit, pemikiran strategis yang mendalam, atau pekerjaan kreatif yang berisiko tinggi. Cocokkan tenaga kuda dengan jalan raya.
2. Memanfaatkan Model Lokal dan Sumber Terbuka
Untuk mengurangi tagihan cloud AI yang besar, perusahaan semakin banyak meminta karyawan untuk menggunakan model sumber terbuka yang berjalan secara lokal di server perusahaan atau langsung di perangkat karyawan. Jika Anda mengontrol infrastruktur, Anda berhenti membayar biaya token ke laboratorium pihak ketiga. Biaya pemasangan di muka memang nyata, namun penghematan jangka panjangnya sangat besar.
3. Perhatikan Pasar Global
Data menunjukkan bahwa laboratorium AI Tiongkok saat ini menawarkan token dengan harga yang jauh lebih rendah dibandingkan laboratorium AI di AS, didorong oleh energi yang lebih murah dan model yang sangat efisien. Keuntungan biaya ini memberi mereka lonjakan besar dalam volume konsumsi token. Pantau dinamika harga global saat Anda membangun tumpukan teknologi. Token termurah tidak selalu merupakan token terbaik, namun perlu diketahui ke mana arah pasar.
Mempercepat Digitalitas, Secara Berkelanjutan
Pada akhirnya, benartransformasi digitalbukan tentang adopsi buta. Ini tentang menyelaraskan teknologi mutakhir dengan efisiensi bisnis yang sebenarnya.
Jangan biarkan rasa takut ketinggalan mendorong Anda untuk memberikan cek kosong kepada tim Anda untuk kekuatan komputasi. Tentukan ROI. Cocokkan model dengan tugas. Pertahankan tata kelola yang ketat atas tumpukan teknologi Anda.
Revolusi AI tidak melambat. Itu baru saja tumbuh dewasa. Dan tumbuh dewasa berarti belajar hidup sesuai anggaran.
Tetap terdepan—dan sesuai anggaran.
— Yakobus


