[579] Implement calculation of embodied emissions for AWS

davidmytton · ccasher · commit 6b6f82cf3862 · 2021-12-15T16:20:18.000-07:00
Towards cloud-carbon-footprint/cloud-carbon-footprint#579
diff --git a/coefficients.ipynb b/coefficients.ipynb
@@ -33,6 +33,131 @@
     "import warnings; warnings.simplefilter('ignore')"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Embodied emissions\n",
+    "\n",
+    "### Constants\n",
+    "\n",
+    "These constants are used as part of the calculations for the embodied emissions\n",
+    "factors for each instance type. They're based on [the work done by\n",
+    "Teads](https://medium.com/teads-engineering/building-an-aws-ec2-carbon-emissions-dataset-3f0fd76c98ac)\n",
+    "and extracted from [the source Google\n",
+    "Sheet](https://docs.google.com/spreadsheets/d/1YhtGO_UU9Hc162m7eQKYFQOnV4_yEK5_lgHYfl02JPE/edit#gid=2090774556)."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# Manufacturing emissions for a mono socket, low DRAM, no local storage \n",
+    "# commodity rack server\n",
+    "BASE_MANUFACTURING_EMISSIONS = 1000 # kgCO2eq\n",
+    "\n",
+    "# Commodity rack server lifespan\n",
+    "RACK_SERVER_LIFESPAN = 4 # years\n",
+    "\n",
+    "# Hourly manufacturing emissions conversion factor - linearly amortised\n",
+    "MANUFACTURING_EMISSIONS = BASE_MANUFACTURING_EMISSIONS / RACK_SERVER_LIFESPAN / 12 / 30 / 24 # gCO2eq/hour\n",
+    "\n",
+    "# DRAM Threshold to unlock additional Scope 3 emissions\n",
+    "DRAM_THRESHOLD = 16 # GB\n",
+    "\n",
+    "# Manufacturing emissions for the threshold DRAM amount\n",
+    "# Based on Dell PowerEdge R740 Life-Cycle Assessment\n",
+    "# https://docs.google.com/spreadsheets/d/1YhtGO_UU9Hc162m7eQKYFQOnV4_yEK5_lgHYfl02JPE/edit#gid=954946016\n",
+    "# = 533 kgCO₂eq for 12*32GB DIMMs Memory (384 GB).\n",
+    "DRAM_MANUFACTURING_EMISSIONS = (533 / 384) * DRAM_THRESHOLD\n",
+    "\n",
+    "# Manufacturing emissions per additional CPU\n",
+    "CPU_MANUFACTURING_EMISSIONS = 100 # kgCO2eq\n",
+    "\n",
+    "# Manufacturing emissions per additional HDD\n",
+    "HDD_MANUFACTURING_EMISSIONS = 50 # kgCO2eq\n",
+    "\n",
+    "# Manufacturing emissions per additional SSD\n",
+    "SSD_MANUFACTURING_EMISSIONS = 100 # kgCO2eq\n",
+    "\n",
+    "# Manufacturing emissions per additional GPU Card\n",
+    "GPU_MANUFACTURING_EMISSIONS = 150 # kgCO2eq\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Calculations\n",
+    "\n",
+    "Embodied emissions are based on a representative baeline\n",
+    "(`BASE_MANUFACTURING_EMISSIONS`) with additional factor added for extra\n",
+    "components - memory, storage, CPUs and GPUs."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "aws_cpus = pd.read_csv(f'data/aws-instance-cpus.csv')\n",
+    "\n",
+    "def calculate_additional_memory_emissions(platform_memory):\n",
+    "    \"\"\"If the platform memory is greater than the baseline, calculate the   \n",
+    "    additional emissions.\"\"\"\n",
+    "\n",
+    "    if float(platform_memory) > DRAM_THRESHOLD:\n",
+    "        #print(instance)\n",
+    "        additional_emissions = float((float(platform_memory) - DRAM_THRESHOLD) * (DRAM_MANUFACTURING_EMISSIONS / DRAM_THRESHOLD))\n",
+    "        \n",
+    "    else: \n",
+    "        additional_emissions = 0.0\n",
+    "\n",
+    "    return additional_emissions\n",
+    "\n",
+    "def calculate_additional_storage_emissions(storage_type, drive_quantity):\n",
+    "    \"\"\"Calculate additional emissions for storage, depending on the storage \n",
+    "    type.\"\"\"\n",
+    "\n",
+    "    if drive_quantity <= 0:\n",
+    "        return 0.0\n",
+    "\n",
+    "    if storage_type.lower() == 'ssd':\n",
+    "        factor = SSD_MANUFACTURING_EMISSIONS\n",
+    "    else:\n",
+    "        factor = HDD_MANUFACTURING_EMISSIONS\n",
+    "\n",
+    "    return float(drive_quantity * factor)\n",
+    "\n",
+    "def calculate_additional_cpu_emissions(platform_name, cpu_name):\n",
+    "    \"\"\"Calculate emissions for additional CPUs for the specified cloud\n",
+    "    platform.\"\"\"\n",
+    "\n",
+    "    if platform_name == 'aws':\n",
+    "        cpus = aws_cpus\n",
+    "    else:\n",
+    "        return 0.\n",
+    "\n",
+    "    cpu = cpus.query(f'`CPU Name` == \\\"{cpu_name}\\\"')\n",
+    "\n",
+    "    if int(cpu['Platform Number of CPU Socket(s)']) > 0:\n",
+    "        return float((int(cpu['Platform Number of CPU Socket(s)']) - 1) * CPU_MANUFACTURING_EMISSIONS)\n",
+    "    else:\n",
+    "        return 0.0\n",
+    "\n",
+    "def calculate_additional_gpu_emissions(gpu_quantity):\n",
+    "    \"\"\"Calculate additional emissions for any GPUs.\"\"\"\n",
+    "\n",
+    "    if gpu_quantity > 0:\n",
+    "        return float(gpu_quantity * GPU_MANUFACTURING_EMISSIONS)\n",
+    "    else:\n",
+    "        return 0.0\n",
+    "    "
+   ]
+  },
   {
    "cell_type": "markdown",
    "metadata": {},
@@ -48,8 +173,9 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "# Loads a CSV file then returns each row appended to an array\n",
-    "def load_append_data(file_name):\n",
+    "def load_append_list(file_name):\n",
+    "    \"\"\"Loads a CSV file then returns each row appended to a list.\"\"\"\n",
+    "\n",
     "    with open(f'data/{file_name}', 'r') as csvfile:\n",
     "        reader = csv.reader(csvfile)\n",
     "\n",
@@ -59,25 +185,25 @@
     "        \n",
     "        return data\n",
     "\n",
-    "cpus_amd_epyc_gen1 = load_append_data('amd-epyc-gen1.csv')\n",
+    "cpus_amd_epyc_gen1 = load_append_list('amd-epyc-gen1.csv')\n",
     "assert 'EPYC 7601' in cpus_amd_epyc_gen1\n",
-    "cpus_amd_epyc_gen2 = load_append_data('amd-epyc-gen2.csv')\n",
+    "cpus_amd_epyc_gen2 = load_append_list('amd-epyc-gen2.csv')\n",
     "assert 'EPYC 7742' in cpus_amd_epyc_gen2\n",
-    "cpus_amd_epyc_gen3 = load_append_data('amd-epyc-gen3.csv')\n",
+    "cpus_amd_epyc_gen3 = load_append_list('amd-epyc-gen3.csv')\n",
     "assert 'EPYC 75F3' in cpus_amd_epyc_gen3\n",
-    "cpus_intel_sandybridge = load_append_data('intel-sandybridge.csv')\n",
+    "cpus_intel_sandybridge = load_append_list('intel-sandybridge.csv')\n",
     "assert 'E5-4610' in cpus_intel_sandybridge\n",
-    "cpus_intel_ivybridge = load_append_data('intel-ivybridge.csv')\n",
+    "cpus_intel_ivybridge = load_append_list('intel-ivybridge.csv')\n",
     "assert 'E5-2609 v2' in cpus_intel_ivybridge\n",
-    "cpus_intel_haswell = load_append_data('intel-haswell.csv')\n",
+    "cpus_intel_haswell = load_append_list('intel-haswell.csv')\n",
     "assert 'E5-2630 v3' in cpus_intel_haswell\n",
-    "cpus_intel_broadwell = load_append_data('intel-broadwell.csv')\n",
+    "cpus_intel_broadwell = load_append_list('intel-broadwell.csv')\n",
     "assert 'E5-2683 v4' in cpus_intel_broadwell\n",
-    "cpus_intel_skylake = load_append_data('intel-skylake.csv')\n",
+    "cpus_intel_skylake = load_append_list('intel-skylake.csv')\n",
     "assert 'Platinum 8160T' in cpus_intel_skylake\n",
-    "cpus_intel_cascadelake = load_append_data('intel-cascadelake.csv')\n",
+    "cpus_intel_cascadelake = load_append_list('intel-cascadelake.csv')\n",
     "assert 'Gold 6230R' in cpus_intel_cascadelake\n",
-    "cpus_intel_coffeelake = load_append_data('intel-coffeelake.csv')\n",
+    "cpus_intel_coffeelake = load_append_list('intel-coffeelake.csv')\n",
     "assert 'E-2246G' in cpus_intel_coffeelake"
    ]
   },
@@ -563,6 +689,8 @@
    "source": [
     "## Azure\n",
     "\n",
+    "### Use stage coefficients\n",
+    "\n",
     "These values go in [`packages/azure/src/domain/AzureFootprintEstimationConstants.ts`](https://github.com/cloud-carbon-footprint/cloud-carbon-footprint/blob/trunk/packages/azure/src/domain/AzureFootprintEstimationConstants.ts)"
    ]
   },
@@ -781,6 +909,8 @@
    "source": [
     "## AWS\n",
     "\n",
+    "### Use stage coefficients\n",
+    "\n",
     "These values go in [`packages/aws/src/domain/AwsFootprintEstimationConstants.ts`](https://github.com/cloud-carbon-footprint/cloud-carbon-footprint/blob/trunk/packages/aws/src/domain/AwsFootprintEstimationConstants.ts)"
    ]
   },
@@ -954,12 +1084,80 @@
     "#assert float('{:,.2f}'.format(aws_coefficients[\"GB/Chip\"].mean())) == 80.69"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Embodied emissions"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "aws_instances_embodied = []\n",
+    "\n",
+    "for key, instance in aws_instances.iterrows():\n",
+    "    # Call our calculation methods for each of the additional components\n",
+    "    additional_memory = calculate_additional_memory_emissions(\n",
+    "        instance['Platform Memory (in GB)'])\n",
+    "    additional_storage = calculate_additional_storage_emissions(\n",
+    "        instance['Storage Type'],\n",
+    "        instance['Platform Storage Drive Quantity']\n",
+    "    )\n",
+    "    additional_cpus = calculate_additional_cpu_emissions(\n",
+    "        'aws',\n",
+    "        instance['Platform CPU Name']\n",
+    "    )\n",
+    "    additional_gpus = calculate_additional_gpu_emissions(\n",
+    "        instance['Platform GPU Quantity']\n",
+    "    )\n",
+    "\n",
+    "    # Build a dictionary of the instance emissions\n",
+    "    aws_instances_embodied.append({\n",
+    "        'type': instance['Instance type'],\n",
+    "        'additional_memory': round(additional_memory, 2),\n",
+    "        'additional_storage': round(additional_storage, 2),\n",
+    "        'additional_cpus': round(additional_cpus, 2),\n",
+    "        'additional_gpus': round(additional_gpus, 2),\n",
+    "        'total': round(BASE_MANUFACTURING_EMISSIONS + additional_memory + additional_storage + additional_cpus + additional_gpus, 2)\n",
+    "    })\n",
+    "\n",
+    "aws_instances_embodied = pd.DataFrame(aws_instances_embodied)\n",
+    "\n",
+    "# Pick some random instances to test the results are as expected\n",
+    "result = aws_instances_embodied.query('type == \\\"a1.medium\\\"')\n",
+    "assert np.isclose(result['additional_memory'], 22.21)\n",
+    "assert np.isclose(result['additional_storage'], 0)\n",
+    "assert np.isclose(result['additional_cpus'], 0)\n",
+    "assert np.isclose(result['additional_gpus'], 0)\n",
+    "assert np.isclose(result['total'], 1022.21)\n",
+    "\n",
+    "result = aws_instances_embodied.query('type == \\\"c3.xlarge\\\"')\n",
+    "assert np.isclose(result['additional_memory'], 61.07)\n",
+    "assert np.isclose(result['additional_storage'], 200.0)\n",
+    "assert np.isclose(result['additional_cpus'], 100.0)\n",
+    "assert np.isclose(result['additional_gpus'], 0)\n",
+    "assert np.isclose(result['total'], 1361.07)\n",
+    "\n",
+    "result = aws_instances_embodied.query('type == \\\"g4dn.xlarge\\\"')\n",
+    "assert np.isclose(result['additional_memory'], 510.79)\n",
+    "assert np.isclose(result['additional_storage'], 200.0)\n",
+    "assert np.isclose(result['additional_cpus'], 100.0)\n",
+    "assert np.isclose(result['additional_gpus'], 1200.0)\n",
+    "assert np.isclose(result['total'], 3010.79)"
+   ]
+  },
   {
    "cell_type": "markdown",
    "metadata": {},
    "source": [
     "## GCP\n",
     "\n",
+    "### Use stage coefficients\n",
+    "\n",
     "These values go in [`packages/gcp/src/domain/GcpFootprintEstimationConstants.ts`](https://github.com/cloud-carbon-footprint/cloud-carbon-footprint/blob/trunk/packages/gcp/src/domain/GcpFootprintEstimationConstants.ts)"
    ]
   },
diff --git a/data/README.md b/data/README.md
@@ -11,6 +11,8 @@ supports.
 - [AWS Instance Types](https://aws.amazon.com/ec2/instance-types/) based on
   [Teads Carbon Footprint
   Dataset](https://docs.google.com/spreadsheets/d/1YhtGO_UU9Hc162m7eQKYFQOnV4_yEK5_lgHYfl02JPE/edit#gid=504755275).
+- AWS Instance CPUs based on [Teads AWS Platforms Ratios
+  sheet](https://docs.google.com/spreadsheets/d/1YhtGO_UU9Hc162m7eQKYFQOnV4_yEK5_lgHYfl02JPE/edit#gid=1695769209).
 - [Azure Machine
   Types](https://azure.microsoft.com/en-us/pricing/details/virtual-machines/linux/)
 - [GCP Machine Types](https://cloud.google.com/compute/docs/machine-types)
diff --git a/data/aws-instance-cpus.csv b/data/aws-instance-cpus.csv
@@ -0,0 +1,24 @@
+CPU Name,Platform Total Number of vCPU,Platform Number of CPU Socket(s),Total Number of vCPU per socket
+Xeon E5-2666 v3,40,2,20
+Xeon E5-2676 v3,48,2,24
+Xeon E5-2686 v4,72,2,36
+Xeon E5-2650,32,2,16
+Xeon E5-2665,32,2,16
+Xeon E5-2670,32,2,16
+Xeon E5-2651 v2,48,2,24
+Xeon E5-2670 v2,40,2,20
+Xeon E5-2680 v2,40,2,20
+Xeon E7-8880 v3,128,4,32
+Xeon Platinum 8124M,72,2,36
+Xeon Platinum 8151,48,2,24
+Xeon Platinum 8175M,96,2,48
+Xeon Platinum 8176M,448,8,56
+Xeon Platinum 8252C,48,2,24
+Xeon Platinum 8259CL,96,2,48
+Xeon Platinum 8275CL,96,2,48
+Xeon Platinum 8375C,128,2,64
+EPYC 7571,96,2,48
+EPYC 7R32,96,1,96
+Graviton,16,1,16
+Graviton2,64,1,64
+Core i7-8700B,12,1,12