0
Как я могу округлить double precision floating point
до значения, которое может быть сохранено в 8bit floating point
? Я пытаюсь сделать это математически, но я понятия не имею, как это сделать.Число квантования с плавающей запятой от двух до 8 бит
У меня есть x
double
номер, и я должен найти ближайший y
, что я могу выразить с n*2^b
с n
и b
целыми и n
в [-128,127]
. Но как я могу найти лучшие n
и b
?