Catherine Olsson

Citée par

	Toutes	Depuis 2019
Citations	15731	12067
indice h	27	26
indice i10	28	27

3700

1850

925

2775

2014201520162017201820192020202120222023202472 153 779 1066 1305 1440 1612 1806 1940 3617 1635

Accès public

Tout afficher

1 article

0 article

disponibles

non disponibles

Sur la base des exigences liées au financement

Coauteurs

Tuan-Hung VuResearch scientist, valeo.aiAdresse e-mail validée de valeo.com
Ivan LaptevVisiting professor at MBZUAI, on leave from INRIAAdresse e-mail validée de inria.fr
Josef SivicCzech Technical University, CIIRC, ELLIS Unit PragueAdresse e-mail validée de cvut.cz
Aude OlivaSenior Research Scientist, CSAIL, MIT Director MIT-IBM Lab, MIT College Director IndustryAdresse e-mail validée de mit.edu

Suivre

Catherine Olsson

Anthropic

Adresse e-mail validée de mit.edu

Machine Learning


Titre Trier par citations Trier par année Trier par titre	Citée par Citée par	Année
Estimating the reproducibility of psychological science Open Science Collaboration Science 349 (6251), aac4716, 2015	9210	2015
Dota 2 with large scale deep reinforcement learning C Berner, G Brockman, B Chan, V Cheung, P Dębiak, C Dennison, ... arXiv preprint arXiv:1912.06680, 2019	1684	2019
An open, large-scale, collaborative effort to estimate the reproducibility of psychological science Open Science Collaboration Perspectives on Psychological Science 7, 657-660, 2012	727	2012
Training a helpful and harmless assistant with reinforcement learning from human feedback Y Bai, A Jones, K Ndousse, A Askell, A Chen, N DasSarma, D Drain, ... arXiv preprint arXiv:2204.05862, 2022	676	2022
Constitutional ai: Harmlessness from ai feedback Y Bai, S Kadavath, S Kundu, A Askell, J Kernion, A Jones, A Chen, ... arXiv preprint arXiv:2212.08073, 2022	583	2022
Tensorfuzz: Debugging neural networks with coverage-guided fuzzing A Odena, C Olsson, D Andersen, I Goodfellow International Conference on Machine Learning, 4901-4911, 2019	341	2019
Language models (mostly) know what they know S Kadavath, T Conerly, A Askell, T Henighan, D Drain, E Perez, ... arXiv preprint arXiv:2207.05221, 2022	221	2022
A general language assistant as a laboratory for alignment A Askell, Y Bai, A Chen, D Drain, D Ganguli, T Henighan, A Jones, ... arXiv preprint arXiv:2112.00861, 2021	214	2021
Red teaming language models to reduce harms: Methods, scaling behaviors, and lessons learned D Ganguli, L Lovitt, J Kernion, A Askell, Y Bai, S Kadavath, B Mann, ... arXiv preprint arXiv:2209.07858, 2022	212	2022
In-context learning and induction heads C Olsson, N Elhage, N Nanda, N Joseph, N DasSarma, T Henighan, ... arXiv preprint arXiv:2209.11895, 2022	188	2022
Predictability and surprise in large generative models D Ganguli, D Hernandez, L Lovitt, A Askell, Y Bai, A Chen, T Conerly, ... Proceedings of the 2022 ACM Conference on Fairness, Accountability, and …, 2022	171	2022
A mathematical framework for transformer circuits N Elhage, N Nanda, C Olsson, T Henighan, N Joseph, B Mann, A Askell, ... Transformer Circuits Thread 1, 1, 2021	148	2021
Discriminator rejection sampling S Azadi, C Olsson, T Darrell, I Goodfellow, A Odena arXiv preprint arXiv:1810.06758, 2018	148	2018
Toy models of superposition N Elhage, T Hume, C Olsson, N Schiefer, T Henighan, S Kravec, ... arXiv preprint arXiv:2209.10652, 2022	139	2022
Is generator conditioning causally related to GAN performance? A Odena, J Buckman, C Olsson, T Brown, C Olah, C Raffel, I Goodfellow International conference on machine learning, 3849-3858, 2018	136	2018
Discovering language model behaviors with model-written evaluations E Perez, S Ringer, K Lukošiūtė, K Nguyen, E Chen, S Heiner, C Pettit, ... arXiv preprint arXiv:2212.09251, 2022	124	2022
Dawn Drain N Elhage, N Nanda, C Olsson, T Henighan, N Joseph, B Mann, A Askell, ... Deep Ganguli, Zac Hatfield-Dodds, Danny Hernandez, Andy Jones, Jackson …, 2021	117	2021
Dawn Drain C Olsson, N Elhage, NJ Neel Nanda, N DasSarma, T Henighan, B Mann, ... Deep Ganguli, Zac Hatfield-Dodds, Danny Hernandez, Scott Johnston, Andy …, 2022	107	2022
Dota 2 with large scale deep reinforcement learning CB OpenAI, G Brockman, B Chan, V Cheung, P Debiak, C Dennison, ... arXiv preprint arXiv:1912.06680 2, 2019	104	2019
Unrestricted adversarial examples TB Brown, N Carlini, C Zhang, C Olsson, P Christiano, I Goodfellow arXiv preprint arXiv:1809.08352, 2018	95	2018

Le système ne peut pas réaliser cette opération maintenant. Veuillez réessayer plus tard.

Articles 1–20

Nombre de citations par an

Citations en double

Citations fusionnées

Ajouter les coauteursCoauteurs

Suivre

Citée par

Coauteurs