Sobhan Miryoosefi

Citée par

	Toutes	Depuis 2019
Citations	426	426
indice h	6	6
indice i10	5	5

160

120

2020202120222023202413 57 143 135 76

Accès public

Tout afficher

1 article

0 article

disponibles

non disponibles

Sur la base des exigences liées au financement

Coauteurs

Chi JinAssistant Professor, Princeton UniversityAdresse e-mail validée de princeton.edu
Miroslav DudikMicrosoft ResearchAdresse e-mail validée de microsoft.com
Kianté BrantleyCornell UniversityAdresse e-mail validée de cornell.edu
Qinghua LiuPrinceton UniversityAdresse e-mail validée de princeton.edu
Hal Daumé IIIAssociate Professor of Computer Science, University of MarylandAdresse e-mail validée de umiacs.umd.edu
Robert SchapireMicrosoft ResearchAdresse e-mail validée de microsoft.com
Wen SunAssistant Professor, Cornell UniversityAdresse e-mail validée de cornell.edu
Thodoris LykourisMITAdresse e-mail validée de mit.edu
MAX SIMCHOWITZMITAdresse e-mail validée de mit.edu
Aleksandrs SlivkinsSenior Principal Researcher, Microsoft Research NYCAdresse e-mail validée de microsoft.com
Sanjiv KumarGoogle Fellow, VP, Google ResearchAdresse e-mail validée de google.com
Yonathan EfroniMeta, New YorkAdresse e-mail validée de fb.com
Akshay KrishnamurthyUniversity of Massachusetts AmherstAdresse e-mail validée de cs.umass.edu
Daliang LiAnthropicAdresse e-mail validée de anthropic.com
Manzil ZaheerGoogle ResearchAdresse e-mail validée de cmu.edu
Zonglin LiGoogle ResearchAdresse e-mail validée de google.com
Satyen KaleResearch Scientist, Google ResearchAdresse e-mail validée de google.com
Sashank J. ReddiResearch Scientist, Google ResearchAdresse e-mail validée de cs.cmu.edu

Suivre

Sobhan Miryoosefi

Google Research

Adresse e-mail validée de google.com - Page d'accueil

Machine Learning Theoretical Machine Learning Reinforcement Learning Natural Language Processing


Titre Trier par citations Trier par année Trier par titre	Citée par Citée par	Année
Bellman Eluder dimension: New rich classes of RL problems, and sample-efficient algorithms C Jin, Q Liu, S Miryoosefi Advances in Neural Information Processing Systems 34, 13406-13418, 2021	215	2021
Reinforcement learning with convex constraints S Miryoosefi, K Brantley, H Daumé III, M Dudík, R Schapire Advances in Neural Information Processing Systems 32, 14093-14102, 2019	94	2019
Constrained episodic reinforcement learning in concave-convex and knapsack settings K Brantley, M Dudik, T Lykouris, S Miryoosefi, M Simchowitz, A Slivkins, ... Advances in Neural Information Processing Systems 33, 16315-16326, 2020	49	2020
Provable reinforcement learning with a short-term memory Y Efroni, C Jin, A Krishnamurthy, S Miryoosefi International Conference on Machine Learning, 5832-5850, 2022	30	2022
A simple reward-free approach to constrained reinforcement learning S Miryoosefi, C Jin International Conference on Machine Learning, 15666-15698, 2022	29	2022
Rest meets react: Self-improvement for multi-step reasoning llm agent R Aksitov, S Miryoosefi, Z Li, D Li, S Babayan, K Kopparapu, Z Fisher, ... arXiv preprint arXiv:2312.10003, 2023	7	2023
Efficient training of language models using few-shot learning SJ Reddi, S Miryoosefi, S Karp, S Krishnan, S Kale, S Kim, S Kumar International Conference on Machine Learning, 14553-14568, 2023	2	2023
Efficient Stagewise Pretraining via Progressive Subnetworks A Panigrahi, N Saunshi, K Lyu, S Miryoosefi, S Reddi, S Kale, S Kumar arXiv preprint arXiv:2402.05913, 2024		2024
Provable Reinforcement Learning with Constraints and Function Approximation SSM Yoosefi Princeton University, 2022		2022

Le système ne peut pas réaliser cette opération maintenant. Veuillez réessayer plus tard.

Articles 1–9

Nombre de citations par an

Citations en double

Citations fusionnées

Ajouter les coauteursCoauteurs

Suivre

Citée par

Coauteurs