Την απόδοση του ChatGPT σε διαφορετικές εργασίες μέσα στη διάρκεια μερικών μηνών, που περιλάμβαναν τη λύση μαθηματικών προβλημάτων, την απάντηση σε ευαίσθητες ερωτήσεις, την παραγωγή κώδικα λογισμικού και άλλα, εξέτασε νέα έρευνα του Stanford University.
Τα αποτελέσματα έδειξαν λοιπόν πως οι ικανότητες του ChatGPT δεν ήταν συνεπείς. Στα μαθηματικά προβλήματα για παράδειγμα, το GPT-4 ξεκίνησε με σωστή αναγνώριση πρώτων αριθμών σε ποσοστό 97.6% το Μάρτιο, αλλά τρεις μήνες μετά η