Raw Record Source

{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreihkq4bug7ra52ambnrlnr7l3fra2tk4o6tcgjoimnirifrnlfjaam",
    "uri": "at://did:plc:25rdn5elo5izoxrmtis34zuk/app.bsky.feed.post/3mov7zjeuxj42"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreie3sky26ox476tdrjejtgojldn3276zcgnzy4qwo4cw7viidmv3pe"
    },
    "mimeType": "image/webp",
    "size": 30548
  },
  "path": "/jamilxt/query-dhiir-gtite-clche-kibhaabe-khunje-ber-krben-smsyaattaa-prb-3-522f",
  "publishedAt": "2026-06-22T15:33:27.000Z",
  "site": "https://dev.to",
  "tags": [
    "database",
    "performance",
    "sql",
    "tutorial",
    "Reading an EXPLAIN plan",
    "পর্ব ২",
    "পর্ব ১"
  ],
  "textContent": "আমার colleague এখন প্ল্যান দেখতে পারছে। Scan types বুঝতে পারছে। Join types বুঝতে পারছে। Estimate আর actual এর gap দেখতে পারছে। BUFFERS ও দেখছে।\n\nকিন্তু সে প্রশ্ন করল। এসব দেখে কি করব? Step by step কোন পথে যাব?\n\nআমি বললাম। পাঁচটা step আছে। অর্ডার অনুযায়ী।\n\nপর্ব ২ এ আমি বলেছিলাম scan types, join types, estimate আর actual এর gap। BUFFERS কি। এবার আসি সমাধান এ।\n\n##  Diagnostic Workflow\n\nআপনার কাছে একটা slow query এসেছে। কিভাবে debug করবেন?\n\nএই পাঁচটা প্রশ্ন করুন অর্ডার অনুযায়ী। ৯০% slow query প্রথম বা দ্বিতীয় ধাপেই solve হয়ে যায়।\n\n###  ১. Deepest Seq Scan দেখুন\n\nTable বড় কি না? Filter selective কি না? Missing index থাকলে add করুন।\n\n**আজই শুরু করুন** যখন একটা Seq Scan দেখবেন big table এ, প্রথমে `WHERE` clause টা check করুন। Selective কি না? ৫% এর কম row return হওয়ার কথা? যদি তাই হয়, index missing। `CREATE INDEX idx_name ON table(column)` run করুন।\n\n###  ২. Join types দেখুন\n\nকোনো Nested Loop আছে কিন্তু দুই পাশেই বড় table? Hash Join force করুন বা ডান পাশে index add করুন।\n\n**আজই শুরু করুন** Nested Loop দেখলে ডান পাশের table এ index check করুন। যদি না থাকে, create করুন। Index থাকা সত্ত্বেও planner Nested Loop use করছে? `SET enable_nestloop = off` temporarily disable করে দেখুন। Hash Join আসবে কি না।\n\n###  ৩. Row estimates দেখুন\n\nEstimate vs actual ১০x এর বেশি difference? ANALYZE table দিন বা predicate rewrite করুন।\n\n**আজই শুরু করুন** `rows=1` estimate কিন্তু `rows=100000` actual দেখলে `ANALYZE tablename` run করুন। Statistics refresh হবে। তারপর plan আবার দেখুন। যদি তাও না আসে, WHERE clause rewrite করুন। Function call থাকলে remove করুন। Type mismatch থাকলে fix করুন।\n\n###  ৪. BUFFERS add করুন\n\nকোনো node এ অনেক disk reads? Caching investigate করুন।\n\n**আজই শুরু করুন** `EXPLAIN (ANALYZE, BUFFERS)` run করে দেখুন `shared read` high কোথায়। সেই node টাই bottleneck। Index add করলে reads কমবে। Pre-warm cache করতে পারেন। Data pre-load করতে পারেন।\n\n###  ৫. Sorts আর hashes দেখুন\n\nকোনো spill-to-disk আছে? work_mem raise করুন বা sort eliminate করুন।\n\n**আজই শুরু করুন** Plan এ `external merge Disk: 421MB` দেখলে spill-to-disk হয়েছে। `SET work_mem = '256MB'` temporarily raise করে দেখুন। অথবা query rewrite করে memory requirement কমান। Hash join এর যে পাশ ছোট সেই পাশ এ পাঠান।\n\nএই পাঁচটা ধাপে ১০ মিনিট এর মধ্যে সব slow query solve হবে। যদি পঞ্চম ধাপে যাওয়ার পরেও কিছু না পান, তারমানে query already as fast as possible। এখন schema change করতে হবে। Denormalized column add করতে পারেন। Pre-aggregation করতে পারেন। Materialized view বানাতে পারেন।\n\n##  BigQuery, Snowflake এ কি?\n\nআপনি যদি BigQuery বা Snowflake use করেন তাহলে কি? কথা একই। Vocabulary change হয়। Postgres এ Hash Join, BigQuery এ Stage 3: JOIN। Snowflake এ Hash Join probe side। কিন্তু concept same। তিনটা জিনিস দেখবেনই। table কিভাবে read হচ্ছে, join কিভাবে implement হচ্ছে, estimate match করছে কি না।\n\nColumnar warehouse এ একটা extra জিনিস। কত bytes query scan করেছে। ওরা per byte charge করে। ৫TB scan আর ৫০GB scan একই answer দিতে পারে, কিন্তু ৫০GB সস্তা।\n\n##  Common Mistakes\n\nকিছু common mistake আছে যা avoid করবেন।\n\nCost number কে seconds ভাববেন না। সেটা not seconds। Node compare করার জন্য, time predict করার জন্য না।\n\nANALYZE skip করবেন না। EXPLAIN without ANALYZE planner এর guess। Actuals থেকেই সত্যি বের হয়।\n\nANALYZE ছাড়া query tune করবেন না। Stale statistics থেকে bad plan। Refresh করুন, তারপর plan পড়ুন, তারপর tune করুন।\n\nLocal dev এর plan এর উপর ভরসা করবেন না। আপনার machine এ tiny data, hot cache। Production এ large data, cold cache। Prod এ বা prod-like copy তে EXPLAIN ANALYZE run করুন।\n\nশুধু \"it uses an index\" এ থেমে যাবেন না। Index ব্যবহার করতে পারে ভুল ভাবে। ১০ মিলিয়ন outer row এর সাথে Nested Loop যেখানে প্রতিটা row এর জন্য index lookup, সেটা ১০ মিলিয়ন round trip। Plan index use করছে, query slow।\n\nবিনা measure এ index add করবেন না। প্রতিটা new index write cost। Insert আর update এর জন্য। শুধু যে query এর দরকার সেটাই add করুন, বাকি গুলো remove করুন।\n\nBUFFERS ignore করবেন না। একই plan এর দুটা query ৩০x difference হতে পারে cache এর কারণে। BUFFERS সেটা বের করে।\n\n##  শেষ করি\n\nEXPLAIN planner এর plan দেখায়। EXPLAIN ANALYZE query run করে truth দেখায়। যখন পারবেন ANALYZE use করুন।\n\nতিনটা signal most important। biggest table এ scan type, join type, estimate আর actual row এর gap।\n\nSeq Scan ছোট table এ fine, বড় table এ red flag। Nested Loop index এর সাথে fast, index ছাড়া disaster।\n\nCost numbers seconds না। Compare করার জন্য, wall-clock time এর জন্য actual time।\n\nEXPLAIN (ANALYZE, BUFFERS) দেখায় disk থেকে কি এসেছে। cold আর warm cache এর মধ্যে ৩০x gap এখানে থাকে।\n\nDiagnostic workflow পাঁচটা প্রশ্ন অর্ডারে। সব slow query missing index বা stale statistics এ পড়ে যায়।\n\nশেষ করি এই কথা দিয়ে। আমার colleague যে query নিয়ে এসেছিল, সেটা solve করতে কত time লাগল জানেন? ৫ মিনিট। তিনি dev এর plan দেখছিলেন। আমি বললাম prod copy তে EXPLAIN ANALYZE run করতে। সেখানে দেখা গেল orders table এ ৫ মিলিয়ন row, but planner estimate করেছিল ১০০। ANALYZE run করার পর plan change হলো। Nested Loop থেকে Hash Join এ। ২০ মিনিট থেকে ২ সেকেন্ড এ এসে গেল।\n\nমানে, সমস্যা ছিল statistics এত। আর সমাধান ছিল PLAN এর মধ্যে, না guess এর মধ্যে।\n\nপ্রশ্ন হলো, আপনার পরের slow query তে আপনি guess করবেন, নাকি PLAN পড়বেন?\n\n**Source:** Reading an EXPLAIN plan by Amirul Islam\n\n**পূর্ববর্তী পর্ব:** পর্ব ২ | পর্ব ১",
  "title": "Query ধীর গতিতে চলছে, কিভাবে খুঁজে বের করবেন সমস্যাটা? (পর্ব ৩)"
}