КОМПЬЮТЕРЫ УЧАТСЯ УЧИТЬ ДРУГ ДРУГА НОВЫМ НАВЫКАМ

Мы всегда говорим, что больше не будем говорить о апокалипсисе роботов, потому что это своего рода глупый путь, который, конечно же, никогда не осуществится. А потом, компьютерщики идут и делают что-то вроде этого ...

По словам Джона Тиммера из Ars Technica, компьютерные ученые не только учили компьютер, как притворяться добычей снайперов, но и учат тому, как научить себя лучше выполнять свою задачу. А ТАКЖЕ. Они научили своего нового эксперта-охотника-снайпера-бота, как научить другие компьютеры развивать этот навык быстрее.

Объедините это с другим текущим проектом, чтобы научить роботов объединяться друг с другом, и мы в основном строим Гет, или те вещи из Матрицы, или что-то еще.

Для StarCraft игра была настроена так, чтобы, используя укрытие и стрельбу на расстоянии, человек мог убить зергов, прежде чем он был убит. Чтобы человек не скрывался, со временем счет игрока снижался: чем дольше игра проходила, тем хуже оценка. Алгоритм оценил всего шесть факторов, таких как расстояние и относительное здоровье, прежде чем выбирать следующие действия.
При самообучении компьютеры начинали, избегая зергов. Затем они в конечном итоге совершали некий обратный бросок зергов, быстро убивая себя до того, как весь их счет испарился. Наконец, после примерно 200 тренировочных заездов, компьютерам пришла идея снайперской стрельбы и они начали успешно убивать зергов, хотя производительность все еще была довольно неустойчивой.

Когда компьютерам приходилось разбираться в том, как играть в эту модифицированную версию StarCraft, они боролись с рядом неудачных стратегий. Когда компьютер, который (кто?) Уже определил стратегии снайпинга, был соединен с новичком, кривая обучения была резко сокращена.

После разговора с исследователями Тиммер говорит, что это не начало апокалипсиса робота. Но, на самом деле, кто сказал, что он не цилиндр?