]> git.sur5r.net Git - groeck-k10temp/blob - k10temp.c
Add optional 49 degrees C temperature offset
[groeck-k10temp] / k10temp.c
1 /*
2  * k10temp.c - AMD Family 10h/11h/12h/14h/15h/16h processor hardware monitoring
3  *
4  * Copyright (c) 2009 Clemens Ladisch <clemens@ladisch.de>
5  *
6  *
7  * This driver is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License; either
9  * version 2 of the License, or (at your option) any later version.
10  *
11  * This driver is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
14  * See the GNU General Public License for more details.
15  *
16  * You should have received a copy of the GNU General Public License
17  * along with this driver; if not, see <http://www.gnu.org/licenses/>.
18  */
19
20 #include <linux/err.h>
21 #include <linux/hwmon.h>
22 #include <linux/hwmon-sysfs.h>
23 #include <linux/init.h>
24 #include <linux/module.h>
25 #include <linux/pci.h>
26 #include <asm/processor.h>
27
28 MODULE_DESCRIPTION("AMD Family 10h+ CPU core temperature monitor");
29 MODULE_AUTHOR("Clemens Ladisch <clemens@ladisch.de>");
30 MODULE_LICENSE("GPL");
31
32 static bool force;
33 module_param(force, bool, 0444);
34 MODULE_PARM_DESC(force, "force loading on processors with erratum 319");
35
36 /* Provide lock for writing to NB_SMU_IND_ADDR */
37 static DEFINE_MUTEX(nb_smu_ind_mutex);
38
39 #ifndef PCI_DEVICE_ID_AMD_17H_DF_F3
40 #define PCI_DEVICE_ID_AMD_17H_DF_F3     0x1463
41 #endif
42
43 /* CPUID function 0x80000001, ebx */
44 #define CPUID_PKGTYPE_MASK      0xf0000000
45 #define CPUID_PKGTYPE_F         0x00000000
46 #define CPUID_PKGTYPE_AM2R2_AM3 0x10000000
47
48 /* DRAM controller (PCI function 2) */
49 #define REG_DCT0_CONFIG_HIGH            0x094
50 #define  DDR3_MODE                      0x00000100
51
52 /* miscellaneous (PCI function 3) */
53 #define REG_HARDWARE_THERMAL_CONTROL    0x64
54 #define  HTC_ENABLE                     0x00000001
55
56 #define REG_REPORTED_TEMPERATURE        0xa4
57
58 #define REG_NORTHBRIDGE_CAPABILITIES    0xe8
59 #define  NB_CAP_HTC                     0x00000400
60
61 /*
62  * For F15h M60h, functionality of REG_REPORTED_TEMPERATURE
63  * has been moved to D0F0xBC_xD820_0CA4 [Reported Temperature
64  * Control]
65  */
66 #define F15H_M60H_REPORTED_TEMP_CTRL_OFFSET     0xd8200ca4
67
68 /* F17h M01h Access througn SMN */
69 #define F17H_M01H_REPORTED_TEMP_CTRL_OFFSET     0x00059800
70
71 struct k10temp_data {
72         struct pci_dev *pdev;
73         void (*read_tempreg)(struct pci_dev *pdev, u32 *regval);
74         int temp_offset;
75 };
76
77 struct tctl_offset {
78         u8 model;
79         char const *id;
80         int offset;
81 };
82
83 static const struct tctl_offset tctl_offset_table[] = {
84         { 0x17, "AMD Ryzen 5 1600X", 20000 },
85         { 0x17, "AMD Ryzen 7 1700X", 20000 },
86         { 0x17, "AMD Ryzen 7 1800X", 20000 },
87         { 0x17, "AMD Ryzen 7 2700X", 10000 },
88         { 0x17, "AMD Ryzen Threadripper 1950X", 27000 },
89         { 0x17, "AMD Ryzen Threadripper 1920X", 27000 },
90         { 0x17, "AMD Ryzen Threadripper 1900X", 27000 },
91         { 0x17, "AMD Ryzen Threadripper 1950", 10000 },
92         { 0x17, "AMD Ryzen Threadripper 1920", 10000 },
93         { 0x17, "AMD Ryzen Threadripper 1910", 10000 },
94 };
95
96 static void read_tempreg_pci(struct pci_dev *pdev, u32 *regval)
97 {
98         pci_read_config_dword(pdev, REG_REPORTED_TEMPERATURE, regval);
99 }
100
101 static void amd_nb_index_read(struct pci_dev *pdev, unsigned int devfn,
102                               unsigned int base, int offset, u32 *val)
103 {
104         mutex_lock(&nb_smu_ind_mutex);
105         pci_bus_write_config_dword(pdev->bus, devfn,
106                                    base, offset);
107         pci_bus_read_config_dword(pdev->bus, devfn,
108                                   base + 4, val);
109         mutex_unlock(&nb_smu_ind_mutex);
110 }
111
112 static void read_tempreg_nb_f15(struct pci_dev *pdev, u32 *regval)
113 {
114         amd_nb_index_read(pdev, PCI_DEVFN(0, 0), 0xb8,
115                           F15H_M60H_REPORTED_TEMP_CTRL_OFFSET, regval);
116 }
117
118 static void read_tempreg_nb_f17(struct pci_dev *pdev, u32 *regval)
119 {
120         amd_nb_index_read(pdev, PCI_DEVFN(0, 0), 0x60,
121                           F17H_M01H_REPORTED_TEMP_CTRL_OFFSET, regval);
122 }
123
124 static ssize_t temp1_input_show(struct device *dev,
125                                 struct device_attribute *attr, char *buf)
126 {
127         struct k10temp_data *data = dev_get_drvdata(dev);
128         u32 regval;
129         unsigned int temp;
130
131         data->read_tempreg(data->pdev, &regval);
132         temp = (regval >> 21) * 125;
133         /* bit 20 indicates an additional temp offset of 49 degrees C */
134         if (regval & 0x80000)
135                 temp -= 49000;
136         if (temp > data->temp_offset)
137                 temp -= data->temp_offset;
138         else
139                 temp = 0;
140
141         return sprintf(buf, "%u\n", temp);
142 }
143
144 static ssize_t temp1_max_show(struct device *dev,
145                               struct device_attribute *attr, char *buf)
146 {
147         return sprintf(buf, "%d\n", 70 * 1000);
148 }
149
150 static ssize_t show_temp_crit(struct device *dev,
151                               struct device_attribute *devattr, char *buf)
152 {
153         struct sensor_device_attribute *attr = to_sensor_dev_attr(devattr);
154         struct k10temp_data *data = dev_get_drvdata(dev);
155         int show_hyst = attr->index;
156         u32 regval;
157         int value;
158
159         pci_read_config_dword(data->pdev,
160                               REG_HARDWARE_THERMAL_CONTROL, &regval);
161         value = ((regval >> 16) & 0x7f) * 500 + 52000;
162         if (show_hyst)
163                 value -= ((regval >> 24) & 0xf) * 500;
164         return sprintf(buf, "%d\n", value);
165 }
166
167 static DEVICE_ATTR_RO(temp1_input);
168 static DEVICE_ATTR_RO(temp1_max);
169 static SENSOR_DEVICE_ATTR(temp1_crit, S_IRUGO, show_temp_crit, NULL, 0);
170 static SENSOR_DEVICE_ATTR(temp1_crit_hyst, S_IRUGO, show_temp_crit, NULL, 1);
171
172 static umode_t k10temp_is_visible(struct kobject *kobj,
173                                   struct attribute *attr, int index)
174 {
175         struct device *dev = container_of(kobj, struct device, kobj);
176         struct k10temp_data *data = dev_get_drvdata(dev);
177         struct pci_dev *pdev = data->pdev;
178
179         if (index >= 2) {
180                 u32 reg_caps, reg_htc;
181
182                 pci_read_config_dword(pdev, REG_NORTHBRIDGE_CAPABILITIES,
183                                       &reg_caps);
184                 pci_read_config_dword(pdev, REG_HARDWARE_THERMAL_CONTROL,
185                                       &reg_htc);
186                 if (!(reg_caps & NB_CAP_HTC) || !(reg_htc & HTC_ENABLE))
187                         return 0;
188         }
189         return attr->mode;
190 }
191
192 static struct attribute *k10temp_attrs[] = {
193         &dev_attr_temp1_input.attr,
194         &dev_attr_temp1_max.attr,
195         &sensor_dev_attr_temp1_crit.dev_attr.attr,
196         &sensor_dev_attr_temp1_crit_hyst.dev_attr.attr,
197         NULL
198 };
199
200 static const struct attribute_group k10temp_group = {
201         .attrs = k10temp_attrs,
202         .is_visible = k10temp_is_visible,
203 };
204 __ATTRIBUTE_GROUPS(k10temp);
205
206 static bool has_erratum_319(struct pci_dev *pdev)
207 {
208         u32 pkg_type, reg_dram_cfg;
209
210         if (boot_cpu_data.x86 != 0x10)
211                 return false;
212
213         /*
214          * Erratum 319: The thermal sensor of Socket F/AM2+ processors
215          *              may be unreliable.
216          */
217         pkg_type = cpuid_ebx(0x80000001) & CPUID_PKGTYPE_MASK;
218         if (pkg_type == CPUID_PKGTYPE_F)
219                 return true;
220         if (pkg_type != CPUID_PKGTYPE_AM2R2_AM3)
221                 return false;
222
223         /* DDR3 memory implies socket AM3, which is good */
224         pci_bus_read_config_dword(pdev->bus,
225                                   PCI_DEVFN(PCI_SLOT(pdev->devfn), 2),
226                                   REG_DCT0_CONFIG_HIGH, &reg_dram_cfg);
227         if (reg_dram_cfg & DDR3_MODE)
228                 return false;
229
230         /*
231          * Unfortunately it is possible to run a socket AM3 CPU with DDR2
232          * memory. We blacklist all the cores which do exist in socket AM2+
233          * format. It still isn't perfect, as RB-C2 cores exist in both AM2+
234          * and AM3 formats, but that's the best we can do.
235          */
236         return boot_cpu_data.x86_model < 4 ||
237                (boot_cpu_data.x86_model == 4 && boot_cpu_data.x86_mask <= 2);
238 }
239
240 static int k10temp_probe(struct pci_dev *pdev,
241                                    const struct pci_device_id *id)
242 {
243         int unreliable = has_erratum_319(pdev);
244         struct device *dev = &pdev->dev;
245         struct k10temp_data *data;
246         struct device *hwmon_dev;
247         int i;
248
249         if (unreliable) {
250                 if (!force) {
251                         dev_err(dev,
252                                 "unreliable CPU thermal sensor; monitoring disabled\n");
253                         return -ENODEV;
254                 }
255                 dev_warn(dev,
256                          "unreliable CPU thermal sensor; check erratum 319\n");
257         }
258
259         data = devm_kzalloc(dev, sizeof(*data), GFP_KERNEL);
260         if (!data)
261                 return -ENOMEM;
262
263         data->pdev = pdev;
264
265         if (boot_cpu_data.x86 == 0x15 && (boot_cpu_data.x86_model == 0x60 ||
266                                           boot_cpu_data.x86_model == 0x70))
267                 data->read_tempreg = read_tempreg_nb_f15;
268         else if (boot_cpu_data.x86 == 0x17)
269                 data->read_tempreg = read_tempreg_nb_f17;
270         else
271                 data->read_tempreg = read_tempreg_pci;
272
273         for (i = 0; i < ARRAY_SIZE(tctl_offset_table); i++) {
274                 const struct tctl_offset *entry = &tctl_offset_table[i];
275
276                 if (boot_cpu_data.x86 == entry->model &&
277                     strstr(boot_cpu_data.x86_model_id, entry->id)) {
278                         data->temp_offset = entry->offset;
279                         break;
280                 }
281         }
282
283         hwmon_dev = devm_hwmon_device_register_with_groups(dev, "k10temp", data,
284                                                            k10temp_groups);
285         return PTR_ERR_OR_ZERO(hwmon_dev);
286 }
287
288 static const struct pci_device_id k10temp_id_table[] = {
289         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_10H_NB_MISC) },
290         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_11H_NB_MISC) },
291         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_CNB17H_F3) },
292         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_15H_NB_F3) },
293         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_15H_M10H_F3) },
294         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_15H_M30H_NB_F3) },
295         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_15H_M60H_NB_F3) },
296         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_16H_NB_F3) },
297         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_16H_M30H_NB_F3) },
298         { PCI_VDEVICE(AMD, PCI_DEVICE_ID_AMD_17H_DF_F3) },
299         {}
300 };
301 MODULE_DEVICE_TABLE(pci, k10temp_id_table);
302
303 static struct pci_driver k10temp_driver = {
304         .name = "k10temp",
305         .id_table = k10temp_id_table,
306         .probe = k10temp_probe,
307 };
308
309 module_pci_driver(k10temp_driver);